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内 容 提 要 

本 书 旨 在 探讨 如 何 优化 算法 效率 ， 详 细 阐 述 了 经 典 算法 和 特殊 算法 的 实现 、 应 用 技巧 和 复杂 度 验证 

过 程 ， 内 容 由 浅 入 深 ， 能 帮助 读者 快速 掌握 复杂 度 适 当 、 正 确 率 高 的 高 效 编程 方法 以 及 自 检 、 自 测 技巧 ， 

是 参加 ACM/ICPC、Google Code Jam 等 国际 编程 竞赛 、 备 战 编程 考试 、 提 高 编程 效率 、 优 化 编程 方法 的 
参考 书 
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译 者 序 


22 年 前 的 秋天 ， 我 刚刚 进入 初中 时 ， 得 到 了 一 台中 华 学 习 机 。 它 的 1 MHz 主 频 甚至 赶不上 现 
在 一 台 10 元 钱 的 计算 器 。 我 从 第 一 行 用 BASIC 语言 写 的 IF/ELSE 开始 ， 开 启 了 自己 的 编程 人 生 。 
1996 年 ， 还 是 初中 生 的 我 赁 着 不 多 的 算法 和 园 辑 知识 参加 了 国家 信息 学 奥林匹克 竞赛 ， 当 然 ， 最 后 
只 得 到 了 安慰 奖 。 二 十 多 年 后 ， 我 得 知 当 年 斩获 金牌 的 是 王 小 川 ， 如 今 搜 狗 的 CEO. 

现在 ,我 在 一 家 互联 网 公司 负责 技术 并 管理 研发 团队 。 从 自身 的 职业 发 展 经历 ， 以 及 在 中 国 和 
法 国 的 招聘 和 用 人 经 历 中 ， 我 深刻 体会 到 了 软件 工程 师 的 成 就 在 很 大 程度 上 取决 于 他 的 专业 知识 视 
野 。 这 是 个 很 现实 的 问题 。 因 此 ， 我 在 得 到 翻译 这 本 法 语 技 术 书 的 机 会 时 ， 欣 然 接 受 了 这 个 颇 有 难 
度 的 任务 。 
法 国 是 一 个 盛产 数学 家 的 国度 。 不 同 于 大 家 的 传统 印象 ， 法 国人 在 “浪漫 ”的 同时 ， 在 工作 和 
科研 中 非常 讲究 逻辑 与 验证 一 一 产品 原型 要 验证 ， 技 术 探索 要 验证 。 证 明和 实验 有 着 同样 不 可 或 缺 
的 地 位 。 理 论 和 实践 的 结合 ， 让 法 国学 界 和 企业 界 在 相当 长 时 间 内 保持 着 旺盛 的 生命 力 与 创造 力 。 
这 是 我 在 法 国 8 年 学 习 和 工作 中 的 真实 体验 。 

本 书 由 法 国 国际 信息 学 奥林匹克 竞赛 “国家 队 ” 辅 导 老师 编写 ,凝聚 了 作者 辅导 高 中 生 、 大 学 
生 参 加 国际 信息 学 奥林匹克 竞赛 的 大 量 经 验 和 技巧 。 书 中 提 及 的 部 分 算法 十 分 常见 ， 在 实际 工作 中 
也 十 分 常用 。 但 也 有 男 一 部 分 算法 ,例如 舞蹈 链 算法 以 及 一 些 涉 及 图 论 与 匹配 的 算法 ， 在 中 国 的 大 
学 教育 都 不 太 提 及 。 

在 人 工 智能 和 深度 学 习 大 发 展 的 今天 ，Python 语言 、 算 法 ， 特 别 是 证 明 算法 可 靠 性 和 高 效 性 的 
能 力 ， 是 进入 大 数据 和 人 工 智能 人 才 市 场 的 入 场 券 。 和 希望 读者 善 用 Github 和 作者 准备 的 源 代码 网 
站 ， 以 及 网 上 能 够 找到 的 技术 资源 ， 在 尝试 代码 实现 的 同时 ， 去 理解 算法 复杂 度 的 证 明 过 程 ， 从 而 
彻底 掌握 并 熟练 运用 这 些 凝 罕 了 很 多 代 人 智慧 的 无 形 资产 。 

我 要 感谢 教 我 写 下 第 一 行 代码 的 哥哥 史 轶 ,支持 并 指导 我 参加 国家 信息 学 奥林匹克 竞赛 的 湖北 省 
十 卉 市 东风 汽车 公司 第 四 中 学 的 陈 长 国 老师 ， 用 大 量 课外 知识 开拓 了 我 的 见识 的 东风 汽车 公司 第 一 中 
学 的 吴华 山 老 师 ， 支 持 我 前 往 法 国 留学 的 父母 ， 以 及 一 直 以 来 给 我 带 来 太 多 快乐 的 妻子 和 孩子 。 

由 于 个 人 水 平 有 限 ， 译 文 不 能 做 到 尽善尽美 ， 欢 迎 读者 通过 我 的 个 人 网 站 www.jetwaves.cn 与 
我 交流 。 












































































































































史 世 强 
2017 年 10 月 于 巴黎 
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我 们 编写 本 书 的 主要 动力 是 对 Python 语言 编程 的 热爱 和 对 解决 算法 问题 的 激情 。Python 语言 
能 够 如 此 打动 人 ， 是 因为 这 种 语言 能 让 我 们 编写 清晰 而 优雅 的 代码 ， 把 注意 力 集中 于 算法 的 本 质 步 
又 ， 而 不 需要 过 多 关注 复杂 的 语法 和 数据 结构 。 同 时 ， 我 们 用 Python 完成 编写 程序 后 数 个 月 再 回 
头 来 读 的 时 候 ， 仍 然 可 以 理解 自己 写 的 代码 ， 这 一 点 十 分 有 教 益 。 作 为 本 书 的 作者 ， 我 们 最 希望 的 
是 能 接受 新 的 挑 成 ， 其 次 是 能 经 得 住 各 种 测试 ， 因 为 一 段 程序 代码 只 有 在 毫 无 bug 地 实现 后 ， 我 们 
才 算 真正 地 掌握 了 编程 技巧 。 我 们 希望 用 自己 的 热情 感染 读者 ， 营 造 出 一 种 氛围 ， 鼓 励 大 家 学 习 和 
掌握 扎实 的 算法 和 编程 基础 知识 。 这 种 学 习 经 历 往往 会 受到 大 型 软件 企业 招聘 人 员 的 赏识 ， 而 对 于 
软件 工程 师 或 计算 机 科学 教育 工作 者 来 说 ， 这 对 其 整个 职业 生涯 也 会 有 所 帮助 。 

本 书 按照 主题 而 不 是 技术 分 类 收录 了 128 种 算法 。 其 中 某 些 算法 是 常见 的 经 由 算法 ， 另 一 些 则 
不 太 常 见 。 尤 其 在 读者 备战 ACM-ICPC、Google Code Jam, Facebook Hacker Cup, Prologin 和 
France-ioi 等 编程 竞赛 时 ， 本 书 编写 的 大 量 问题 将 起 到 积极 的 辅导 作用 。 我 们 希望 本 书 能 够 成 为 算 
法 的 基础 教程 和 高 级 程序 设计 教程 的 参考 ， 或 者 能 让 学 习 数 学 和 计算 机 专业 的 读者 看 到 与 众 不 同 的 
进修 内 容 。 读 者 可 以 在 网 站 tryalgo.org (http://tryalgo.org/code/ ) 上 找到 本 书 使 用 的 源 代 码 库 ”, 以 及 
用 来 测试 代码 调试 结果 和 实现 性 能 的 链接 。 
感谢 Huong 和 智 子 ， 如 果 没 有 这 两 位 朋友 的 支持 ， 本 书 是 无 法 完成 的 。 感 谢 法 国 综合 理工 学 院 
和 法 国 高 等 师范 学 院 Cachan 分 校 的 学 生 们 ， 他 们 多 次 通宵 达旦 的 训练 ， 为 本 书 提供 了 很 多 素材 。 
最 后 ， 感 谢 所 有 审阅 手稿 的 朋友 们 ， 他 们 是 René Adad, Evripidis Bampis、Binh-Minh Bui-Xuan, 
Stéphane Henriot, Lê Thanh Dùng Nguyén、Alexandre Nolin 和 Antoine Pietri。 本 书 的 作者 之 一 要 特 
别 感谢 在 Tiers 高 中 时 的 老师 Yves Lemaire 先生 : 当年 就 是 在 这 位 老师 的 启迪 下 ， 作 者 才 初 次 发 现 
了 本 书 2.5 节 中 描述 的 “宝藏 ”。 

最 后 ， 我 们 希望 读者 在 磁 到 算法 难题 时 ， 能 够 耐心 地 花 时 间 去 思考 。 视 愿 大 家 能 在 溃 然 间 找 到 
解答 ， 甚 至 是 一 个 优雅 的 解答 ， 享 受到 胜利 的 喜悦 之 情 。 

好 ， 我 们 要 开始 了 ! 













































































































































































O 也 可 以 用 PyPI 直接 安装 后 下 载 查看 并 执行 。 译 者 注 
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年 轻 人 ， 通 过 本 书 学 习 编 写 算法 ， 
你 将 在 编程 竟 赛 中 大 显 身 手 ， 顺 利通 过 
就 业 面试 ， 卷 起 视 管 大 干 一 场 ， 创 造 更 
多 的 价值 。 





如 今 人 们 仍然 存在 一 种 误解 ， 错 把 程序 员 当 成 当代 的 魔术 师 。 计 算 机 和 逐渐 进入 企业 和 家 庭 ， 成 
为 推动 世界 运行 的 重要 动力 。 但 是 ， 仍 有 太 多 人 在 使 用 计算 机 的 时 候 没 能 掌握 足够 的 知识 ， 充 分 发 
挥 计算 机 的 能 力 ， 来 满足 自己 的 需要 。 懂 得 编程 可 以 让 人 们 在 最 大 程度 上 找到 解决 问题 的 高 效 方 
法 。 算 法 和 编程 成 为 计算 机 行业 中 必 不 可 少 的 工具 。 掌 握 这 些 技能 可 以 让 我 们 在 面 对 困 难 时 提出 有 
创造 力 、 高 效 的 解决 方案 。 

本 书 介绍 了 多 种 解决 某 些 经 典 问 题 的 算法 技术 ,描述 了 问题 出 现 的 场景 ， 并 用 Python 提出 了 
简单 的 解决 方案 。 正 确 地 实现 算法 往往 不 是 一 件 简 单 的 事情 ， 总 需要 避 开 陷阱 ， 也 需要 应 用 一 些 技 
巧 保证 算法 能 够 在 规定 时 间 内 实现 。 本 书 在 阐述 算法 实现 时 附加 了 重要 的 细节 ， 以 帮助 读者 理解 。 

最 近 几 十 年 ,不同 级 别 的 编程 竞赛 在 世界 范围 内 展开 ， 推 广 了 算法 文化 。 兖 赛 考察 的 问题 一 般 
都 是 经 典 问 题 的 变种 ， 隐 藏 在 难以 破解 的 谜 面 背后 ， 让 参赛 者 们 一 筹 莫 展 。 















































































































































1.1 编程 竞赛 


在 编程 部 赛 中 ， 参 赛 者 必须 在 规定 时 间 内 解决 多 个 问题 。 问 题 的 输入 称 为 实例 ( instance )。 举 
个 例子 ， 一 个 输入 实例 可 以 是 最 短路 径 问 题 中 图 的 邻接 和 矩阵。 一般 来 讲 ， 问 题 会 给 出 一 个 输入 实例 
和 它 的 输出 结果 “。 参 赛 者 在 网 上 将 答案 的 源 代码 提交 到 服务 器 ; 之 后 ,服务器 的 后 台 进 程 将 编译 并 









































DQ 用 于 展示 思路 和 代码 测试 。 译 者 注 
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执行 代码 ， 而 后 测试 对 错 。 对 于 某 些 问题 ， 源 代码 在 执行 时 会 被 输入 多 个 实例 ， 并 一 一 执行 ;而 对 
于 其 他 问题 ， 每 次 执行 源 代 码 时 ， 输 入 都 从 一 个 表示 实例 数量 的 整数 开始 。 程 序 必 须 按 顺序 读 取 每 
个 输入 实例 ， 解 决 问题 ， 并 输出 结果 。 如 果 程 序 能 够 在 指定 时 间 内 输出 正确 结果 ， 那 么 提交 的 答案 
就 可 以 被 接受 。 
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图 1.1 ACM 竞赛 的 图 标 形象 地 展示 了 解决 问题 的 步骤 。 参 赛 团队 每 
解决 一 个 问题 时 ， 就 会 得 到 一 个 吹 起 的 气球 


我 们 无 法 列 出 世上 所 有 的 编程 竞赛 名 称 和 竞赛 网 址 。 就 算 有 可 能 ， 这 个 列表 也 会 很 快 过 时 。 但 
无 论 如 何 ， 我 们 在 这 里 还 是 要 简单 介绍 一 下 最 重要 的 几 个 编程 竞赛 。 
e ACM/ ICPC 编程 竞 

这 是 历史 最 悠久 的 竞赛 ， 由 国际 计算 机 协会 (ACM ) 从 1977 年 开始 举办 。 竞 赛 称 为 “国际 大 
学 生 程序 设计 竞赛 ”( ICPC )， 以 巡回 赛 的 方式 进行 。 比 如 ， 巡 回 赛 在 法 国 站 的 起 点 是 西南 欧洲 地 区 
竞赛 4(SWERC )。 地 区 竞赛 的 前 两 名 有 资格 进入 全 球 决赛 。 这 个 竞赛 的 特点 是 每 队 由 3 位 成 员 组 
成 ， 共 用 一 台 计 算 机 。 参 赛 队 在 5 个 小 时 内 从 10 个 问题 中 尝试 挑战 解决 尽 可 能 多 的 问题 。 排 名 的 
第 一 个 依据 是 答案 被 接受 的 数量 (答案 会 被 不 公开 的 用 例 来 测试 ) ; 排名 的 第 二 个 依据 是 解决 问题 
所 耗费 的 时 间 ， 耗 时 以 开始 解 题 到 提交 答案 的 时 长 为 准 。 提 交 一 个 错误 答案 会 被 罚 时 20 分 钟 。 

组 成 一 个 优秀 团队 有 很 多 种 方式 。 一 般 来 说 ， 至 少 需要 一 位 优秀 的 程序 员 和 一 位 优秀 的 数学 
家 ， 以 及 一 位 擅长 不 同 领域 的 专家 ， 比 如 图 论 、 动 态 规划 等 。 他 们 需要 在 承受 巨大 压力 的 前 提 下 通 
力 合作 。 在 竞赛 中 ， 参 赛 者 可 以 用 8 磅 字体 打印 25 页 的 源 代码 作为 参考 。 参 赛 者 还 可 以 访问 Java 
应 用 程序 编程 接口 (API ) 的 在 线 文 档 ， 以 及 C++ 的 在 线 标准 库 文 档 。 




































































e Google Code Jam #42322 
际 计算 机 协会 的 编程 竞赛 仅 限 硕士 及 以 下 学 历 的 学 生 参 加 ， 与 此 不 同 的 是 ，Google Code Jam 
编程 竞赛 对 所 有 人 开放 。 竞 赛 每 年 一 度 ， 举 办 历史 较 短 ， 而 且 仅 限 个 人 参赛 。 每 个 问题 通常 会 包含 
一 系列 简单 实例 ， 解 答 这 些 实例 就 可 以 得 到 一 定 的 分 数 。 同 时 ， 问 题 还 包含 一 系列 步骤 复杂 的 实 
例 ， 这 需要 真正 找到 拥有 合适 复杂 度 的 算法 来 解决 。 直 到 竞赛 结束 ， 参 赛 者 才能 得 知 步 又 较 复杂 的 
实例 是 否 最 终 被 接受 了 。 这 个 竞赛 的 优势 在 于 ， 参 赛 者 在 竞赛 结束 后 可 以 查阅 其 他 参赛 者 提交 的 解 
决 方案 ， 这 种 方式 有 非常 强 的 指导 作用 。Facebook Hacker Cup 编程 竞赛 也 采取 类 似 形式 。 
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e Prologin 编程 竞 


法 国 每 年 为 20 岁 以 下 的 学 生 举 办 一 场 Prologin WEER, EREN AN 4 2 E 


$18 引言 | 3 


地 区 赛 和 决赛 ， 以 考察 参赛 者 解决 算法 问题 的 能 力 。 最 终 决 赛 是 一 场 不 同 寻常 的 36 小 时 苋 赛 ， 参 
赛 者 需要 解决 一 个 人 工 智能 问题 。 每 个 参赛 者 必须 编写 一 个 遵循 组 织 者 设 定 规则 的 游戏 程序 ， 然 后 
以 循环 赛 的 形式 让 游戏 程序 彼此 对 决 ， 以 此 来 决定 参赛 者 的 成 绩 排 名 。 竞 赛 官网 上 prologin.org 对 
此 有 详尽 的 解释 ， 我 们 也 可 以 在 这 里 测试 自己 的 算法 。 





e France-ioi #47222 

France-ioi 协会 由 在 辅助 法 国 初中 生 和 高 中 生 准 备 国际 信息 学 奥林匹克 竞赛 。 从 2012 年 起 , Hh 
会 每 年 举办 “ 河 狸 计算 机 科学 竞赛 ”( 竞赛 的 吉祥 物 是 一 只 河 狸 )， 从 初中 一 年 级 到 高 中 三 年 级 的 学 
生 均 可 参加 。2014 年 ， 全 法 国有 22.8 万 名 参赛 者 。 协 会 官网 france-ioi.org 汇集 了 1000 多 个 有 代表 
性 的 现象 级 算法 题 。 

除了 上 述 竞赛 以 外 ， 也 有 大 量 以 筛选 求职 者 为 目的 举行 的 编程 竞赛 。 比 如 TopCoder 网 站 不 仅 
进行 测试 ， 也 会 对 算法 进行 详细 解释 ， 有 时 讲解 质量 极 高 。 如 果 读 者 希望 训练 编程 能 力 ， 我 们 特别 
推荐 Codeforces， 这 是 一 个 备 受 竞赛 群体 推崇 的 网 站 ， 对 问题 的 解释 总 是 清晰 而 仔细 。 
























































1.1.1 线 上 学 习 网 站 


很 多 网 站 提供 历年 各 大 竞赛 真题 ， 并 可 在 线 测试 答案 ， 供 大 家 学 习 训练 。Google Code Jam 编 
程 竞 赛 和 Prologin 编程 兖 赛 的 官网 也 提供 此 类 功能 。 但 是 ，ACM/ICPC 每 年 的 兖 赛 题目 却 没有 统一 
归纳 。 


© 传统 的 线 上 训练 和 裁判 网 站 
下 列 网 站 uva.onlinejudge.org icpcarchive.ecs.baylor.edu 和 livearchive.onlinejudge.org 总 结 了 大 
量 的 ACM/ICPC 编程 竞赛 的 试题 和 答案 。 


© 中 国 的 线 上 训练 和 裁判 网 站 
中 国 目 前 有 很 多 线 上 训练 算法 能 力 的 网 站 ， 比 如 北京 大 学 的 poj.org、 天 津 大 学 的 acm.tju.edu.cn 
和 浙江 大 学 的 acm.zju.edu.cn。 相 对 于 其 他 网 站 ， 这 些 网 站 更 注重 训练 功能 。 


e 高 级 语言 算法 的 训练 和 裁判 网 站 

spoj.com ( Sphere Online Judge ) 网 站 接受 用 户 使 用 更 多 种 编程 语言 提交 问题 的 解决 方案 ， 其 中 
包括 Python。 

在 本 书 配套 网 站 tryalgo.com 中 ,读者 可 以 找到 应 用 本 书 各 章 讲解 的 知识 和 技巧 来 解决 的 问题 ， 
在 实践 中 检验 从 书 中 学 到 的 算法 知识 。 
编程 竞赛 主要 使 用 的 编程 语言 是 C++ 和 Java 语言 。Google Code Jam 编程 竞赛 接受 所 有 编程 语 
言 ， 因 为 解 题 过 程 是 参赛 者 在 本 地 开发 环境 中 完成 的 。 除 此 之 外 ， 上 面 提 到 的 线 上 训练 和 裁判 网 站 
SPOJ 也 接受 Python 语言 的 解答 方案 。 为 了 解决 因 编程 语言 不 同 而 导致 的 程序 执行 时 间 的 差异 问 
题 ， 线 上 训练 和 裁判 网 站 对 使 用 不 同 编程 语言 的 解答 方案 给 出 了 不 同 的 时 间 限 制 。 但 是 ， 这 种 平衡 
策略 并 不 总 是 准确 的 ， 而 且 , 用 Python 语言 完成 的 解 题 方 案 经 常 不 能 被 正确 执行 。 我 们 希望 这 种 
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情况 在 未 来 几 年 能 够 有 所 改善 。 某 些 线 上 训练 和 裁判 网 站 仍 在 使 用 Java 语言 的 老 版 本 ， 导 致 有 些 很 
实用 的 类 无 法 使 用 ， 如 Scanner 类 。 读 者 在 使 用 这 些 网 站 的 时 候 ， 应 当 注 意 版 本 兼容 问题 。 

















1.1.2 ” 线 上 裁判 的 返回 值 

当 一 段 代 码 被 提交 给 线 上 训练 和 裁判 网 站 的 时 候 ， 会 被 一 系列 不 公开 的 测试 用 例 测 试 ， 测 试 结 
果 和 一 段 简要 的 返回 值 会 反馈 给 提交 者 。 返 回 代 码 有 以 下 几 种 。 
e Accepted: 已 接受 状态 

你 提交 的 代码 在 指定 时 间 内 给 出 了 正确 的 结果 ， 祝 贺 你 ! 





























© Presentation Error: 展示 错误 

程序 基本 能 够 被 接受 ， 但 显示 了 过 多 或 过 少 的 空格 或 换行 符 。 这 种 返回 码 很 少 出 现 。 
e Compilation Error : 编译 错误 

你 的 程序 在 编译 过 程 中 出 了 错 。 一 般 来 说 ， 当 你 点 击 这 条 返回 码 的 时 候 ， 就 能 得 到 错误 的 详细 
信息 。 你 应 当 比 较 一 下 ， 裁 判 和 自己 使 用 的 编译 器 版 本 是 否 有 所 不 同 。 
e Wrong Answer: 错误 答案 

重新 读 一 遍 题 吧 ， 你 肯定 漏 掉 了 什么 细节 。 你 是 和 否 确定 已 经 检查 了 所 有 的 边界 条 件 ? 你 是 否 在 
代码 中 遗留 了 调试 代码 ? 
© Time Limit Exceeded: 执行 超时 

你 的 解答 方案 可 能 没有 达到 足够 优化 的 实现 效率 ， 或 者 代码 的 某 个 角落 里 藏 着 一 个 死 循 环 。 检 查 
循环 变量 ， 确 保 循 环 能 够 终止 。 使 用 一 个 大 规模 的 复杂 测试 用 例 在 本 地 执行 测试 ， 确 保 你 的 代码 性 能 。 


































































































e Runtime Error: 运行 时 错误 

一 般 来 说 ， 这 种 错误 源 于 分 母 为 0 的 除法 运算 、 数 组 下 标 越界 ， 或 者 对 一 个 空 的 堆 执行 了 pop ( ) 
方法 。 其 他 情况 也 会 产生 这 条 错误 提示 ， 比 如 在 使 用 Java 语言 的 解答 方案 中 使 用 了 assert bra, 
这 种 方式 在 编程 竞赛 中 一 般 是 不 被 接受 的 。 

除了 以 上 有 了 明确 意义 的 返回 代码 ， 没 有 返回 代码 的 情况 也 能 够 或 多 或 少 地 提供 一 些 信息 ， 帮 
助 查找 错误 。 以 下 是 一 个 ACM/ICPC/SWERC 竞赛 中 的 真实 案例 。 在 一 道 关 于 图 的 题目 中 ， 明 确 
指出 了 输入 数据 是 连通 图 ， 但 某 个 参赛 团队 对 此 信息 不 太 确定 ， 于 是 编写 了 一 个 测试 连通 性 的 方 
法 : 当 这 个 方法 返回 true 结果 ， 即 输入 为 连通 图 时 ， 程 序 会 进入 死 循 环 (返回 执行 超时 错误 ) ; 
而 当 这 个 方法 返回 false 结果 ， 即 输入 为 非 连通 图 时 ， 程 序 会 执行 一 个 分 母 为 0 的 除法 ( 返回 运 
行 时 错误 )。 这 种 方法 可 以 帮助 参赛 者 探测 到 某 些 测试 用 例 输 入 的 图 并 不 是 题目 中 的 连通 图 ， 从 而 
ARo O 


DQ 这 种 方法 的 目的 是 在 程序 中 故意 留 一 些 缺陷 ， 从 而 通过 返回 值 来 猜测 输入 数据 的 具体 情况 。 




































































译 者 注 


1.2 我 们 的 选择 : Python 


鉴于 Python 编程 语言 的 可 读 性 和 使 用 的 简易 性 ， 本 书 选 用 它 来 描述 算法 。 在 工业 领域 ，Python 
通常 用 于 制作 程序 的 原型 。Python 也 用 于 如 SAGE 这 类 重要 的 项 目 系 统 ， 因 为 其 中 的 核心 内 容 大 多 
用 实现 速度 快 很 多 的 语言 编写 ， 如 C 或 C++。 

现在 我 们 说 说 Python 编程 语言 的 一 些 细节 。 在 Python 中 有 四 个 基本 数据 类 型 : 布尔 型 、 整 型 、 
浮 点 型 和 字符 串 。 与 其 他 大 多 数 的 编程 语言 不 同 ，Python 中 的 整数 不 受 数字 占用 的 二 进 制 位 数 限 
制 ， 而 使 用 高 精度 计算 方式 。 

Python 中 的 高 级 数据 类 型 包括 字典 (dictionary )、 列 表 (list) 和 元 组 (tuple )。 列 表 和 元 组 的 
区 别 是 ， 元 组 是 不 可 变数 据 ， 因 此 可 以 用 作 字 典 中 键 值 对 数据 的 键 。 

网 络 上 有 很 多 Python 的 入 门 教程 ， 如 官网 python.org, David Eppstein 创建 了 一 个 名 为 “Python 
算法 和 数据 结构 ”( PADS ) 的 元 件 库 ， 其 中 也 有 很 好 的 讲解 。 

在 编写 本 书 代 码 的 过 程 中 ， 我 们 遵循 了 PEP8 规范 。 该 规范 细致 地 规定 了 空格 的 使 用 方法 、 变 
量 命 名 规则 ， 等 等 。 我 们 建议 读者 也 遵循 上 述 规范 。 
e Python 2 还 是 Python 3 ? 

Python 3.x 版 本 已 经 于 2008 年 发 布 。 但 直到 今天 ， 由 于 仍 有 大 量 的 类 库 没 有 迁移 到 Python 3.x， 
使 得 许多 开发 工作 还 继续 停留 在 Python 2.x 版 本 。 尽 管 如 此 ， 我 们 仍然 选择 使 用 Python 3.x 来 实现 
算法 。Python 2.x 和 Python 3.x 对 本 书 中 代码 的 主要 影响 在 于 print 语句 的 使 用 方式 ， 以 及 整数 除法 
的 使 用 方式 。 在 Python 3.x 中 ， 对 于 两 个 整数 a Mb, KER a/b 会 返回 除法 的 浮 点 型 的 商 ， 表 达 
式 a//b 返回 的 则 是 两 者 的 欧 几 里 得 商 ， 即 商 的 整数 部 分 。print 的 用 法 区 别 在 于 ,在 Python 2.x 中 
print 是 语句 ， 而 在 Python 3.x P print () 是 需要 使 用 括号 包围 的 参数 来 调用 的 函数 。 

如 果 程 序 运 行 存在 性 能 问题 ， 可 以 考虑 使 用 pypy 或 pypy3 解释 器 来 执行 ， 因 为 这 都 是 实时 纪 
Peat. thet, Python 代码 会 先 被 翻译 为 机 器 码 ， 然 后 才 被 干净 而 迅速 执行 。 但 pypy 的 弱点 在 
于 它 仍 处 在 开发 过 程 中 ， 很 多 Python 类 库 尚 无 法 支持 。 




























































































































































































e EF 

Python 使 用 高 精度 计算 方式 进行 计算 ， 而 不 用 二 进 制 位 数 来 限制 整数 的 大 小 。 所 以 ， 在 Python 
语言 中 不 存在 哪个 数 可 以 指 代 正 无 穷 大 或 负 无 穷 大 的 值 。 但 对 于 浮 点 数 ， 我 们 可 以 用 float ('inf') 
和 float('-inf') 来 指 代 正 、 负 无 穷 大 。 
。 一 些 建议 

Python 的 初学 者 在 复制 列表 数据 时 经 常 犯 一 个 错误 。 在 下 面 的 例子 里 ,列表 B 只 是 一 个 指向 列 
表 A 的 引用 。 对 B[0] 的 修改 同样 会 修改 A[0]。 


A 
B 
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当 复 制 一 个 A 的 独立 副本 时 ， 我 们 可 以 使 用 以 下 语法 格式 : 


A 
B 


语句 [ : ] 用 以 复制 一 个 列表 。 我 们 也 可 以 复制 一 个 去 掉 首 元 素 的 列表 A[1:]， 或 者 去 掉 末 尾 元 
素 的 列表 A[:-1],， 或 者 逆序 的 列表 A[::-1]。 举 例 来 说 ， 下 面 的 代码 会 生成 一 个 所 有 行 完全 相同 的 矩 
阵 M， 而 对 M[0][0] 元 素 的 修改 会 导致 第 一 列 所 有 元 素 被 修改 。 





















































M = [[0] * 10] * 10 

我 们 可 以 用 下 面 两 种 正确 的 方式 来 初始 化 一 个 这 样 的 和 矩阵; 
M1 = [[0] * 10 for _ in range(10) ] 

M2 = [[0 for j in range(10)] for i in range(10) ] 





























PRE AEE AY fi PAT se EA numpy 模块 ， 但 我 们 在 本 书 中 不 使 用 第 三 方 类 库 ， 以 便 让 程序 代 
码 能 更 方便 翻译 成 Java 或 C++ 代码 。 

男 一 个 典型 错误 经 常 发 生 在 使 用 range 语句 时 。 比 如 ， 下 面 的 代码 会 顺序 处 理 列表 A 中 0 至 
9 号 元 素 (包括 0 号 和 9 号 元 素 ) : 

for i in range(0, 10): # 包括 0， 不 包括 10 

treat (A[i]) 

如 果 想 逆序 处 理 上 述 元 素 ,， 仪 反 转 参数 是 不 够 的 。 语 句 range (10, 0, -1) 中 的 第 三 个 参数 
代表 循环 的 步 长 ， 语 句 会 导致 被 处 理 元 素 中 的 10 号 元 素 被 包含 在 内 ， 而 0 号 元 素 被 排除 在 外 。 
此 需要 用 以 下 方式 来 处 理 : 


for i in range(9, -1, -1): # 包括 9， 不 包括 -1 
treat (A[i]) 







































































1.3 输入 输出 


1.3.1 读 取 标准 输入 

在 大 部 分 编程 竞赛 的 题目 中 ， 源 数据 都 需要 从 标准 输入 设备 来 读 取 ， 并 把 输出 显示 到 标准 输出 
设备 上 。 如 果 输 入 文件 名 叫 test. in， 你 的 程序 名 叫 prog . py， 那 就 可 以 在 控制 台 执行 以 下 命 
As, 将 输入 文件 的 内 容重 定向 到 你 的 程序 : 




















python prog.py < test.in 








一 般 来 说 ， 在 Mac OS X 系统 中 ， 控 制 台 可 以 用 Command + 空格 ， 呼 出 
T SpotLight 搜索 后 键入 Terminal 来 打开 ; Æ windows 系统 中 ， 使 用 “开始 - 
执行 -cmd”; Æ Linux 系统 中 ， 使 用 快捷 键 Alt-F2 9, 

















如 果 你 想 把 程序 的 输出 记录 到 名 为 test .out 的 输出 文件 中 ， 使 用 的 命令 格式 如 下 : 














python prog.py < test.in > test.out 


























小 技巧 ， 如 果 你 想 把 输出 写 入 文件 test .out， 同 时 还 要 显示 在 屏幕 上 ， 可 以 使 用 以 下 命令 


( 注意 ，tee 命令 在 Windows 环境 下 默认 是 不 存在 的 ) : 








python prog.py < test.in | tee test.out 














输入 数据 文件 可 以 使 用 input () 语句 按 行 读 取 。input () 语句 把 读 取 到 的 行 用 字符 串 的 形式 
返回 ， 但 不 会 返回 行 尾 的 换行 符 ?。 在 sys 模块 中 有 一 个 类 似 的 方法 stdin .readline () ， 这 个 方 




















法 不 会 删除 行 尾 的 换行 符 ， 但 根据 我 们 的 经 验 ， 它 的 执行 速度 是 input () 语句 的 4 售 。 








如 果 读 取 到 的 行 包 含 的 应 当 是 一 个 整数 ， 我 们 使 用 int 方法 进行 类 型 转换 ;如 果 是 一 个 浮 点 




















数 ， 我 们 使 用 float 方法 。 当 一 行 中 包含 多 个 空格 分 隔 的 整数 时 ， 我 们 首先 使 用 split O 方法 把 





























这 一 行 拆 分 成 独立 的 部 分 ， 然 后 用 map 方法 把 它们 全 部 转换 成 整数 。 举 例 来 说 ， 当 用 空格 分 隔 的 








两 个 整数 一 高 度 和 宽度 ， 需 要 在 同一 行内 被 读 取 时 ， 可 以 使 用 以 下 命令 ”: 











import sys 
height, width = map (int, sys.stdin.readline().split()) 























yl 
个 输入 文件 读 入 ， 速 度 即 可 提升 2 倍 。 在 下 列 语句 中 ， 假 设 输入 数据 中 只 有 来 自 多 行 输入 的 整 


T3 














果 你 的 程序 在 读 取 数 据 时 遇 到 性 能 问题 ， 根 据 我 们 的 经 验 ， 可 以 仅 使 用 一 次 系统 调用 ， 把 整 


os.read() 方法 的 参数 0 表示 标准 输入 流 ， 常 量 M 必须 是 一 个 大 于 文件 大 小 的 限 值 。 比 如 ,文件 





中 包含 了 10’ 个 大 小 在 0 至 10° 之 间 的 整数 ， 那 么 每 个 整数 最 多 只 能 有 10 个 字符 ， 而 两 个 整数 
最 多 只 有 两 个 分 隔 符 Or 和 \n， 即 回 车 和 换行 )， 我 们 可 以 选择 M= 12 .107 。 











Pil 


DO 使 用 组 合 快捷 键 是 个 好 习惯 。 在 Windows mF, Windows 7 和 windows XP 系统 都 可 以 使 用 上 述 方 


A, mÆ Windows 8, Windows 10 和 Windows Server 环境 下 ， 建 议 使 用 Windows+R 组 合 键 呼出 


行 命令 ”窗口 ， 再 输入 cmd 打开 控制 台 ， 或 在 Windows 8 和 Windows 10 环境 下 ， 直 接 按 Windows 


键 打开 “开始 ”屏幕 ， 输 入 cmd 后 回 车 ， 也 可 以 快速 打开 控制 台 。 





译 者 注 


D 根据 操作 系统 的 不 同 ， 换 行 符 可 能 是 或 \n, 或 二 者 民有 ， 但 使 用 input () 输入 的 时 候 不 需要 考 
虑 这 个 问题 。 注 意 在 Python2.x 中 ，input () 方法 的 行为 是 不 同 的 ， 同 样 ， 应 当 使 用 等 价 的 raw_ 


input () 方法 。 
© ”以 下 命令 中 使 用 了 map 及 管道 概念 。 





译 者 注 
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import os 
inputs = list(map(int, os.read(0, M).split())) 











e 例子 : 读 取 三 个 矩阵 A、B、C， 并 测试 是 否 AB = C 
在 此 例子 中 ， 输 入 格式 如 下 : 第 一 行 包含 一 个 唯一 的 整数 n， 接 下 来 的 3n 行 ， 











每 行 包含 n 个 被 





空格 分 隔 的 整数 。 这 些 行 代表 三 个 nxn FAME AL B, 内 包含 的 所 有 元 素 。 例 子 的 目的 是 测试 矩阵 
A x B 的 结果 是 否 等 于 矩阵 C。 最 简单 的 方法 是 使 用 矩阵 乘法 的 解法 ， 复 杂 度 是 O05)。 但 是 ， 有 一 




















个 可 能 的 解法 ,复杂 度 仅 有 O(n”)， 即 随机 选择 一 个 向 量 x， 并 测试 A(Bx) = Cx。 这 


种 测试 方法 叫 作 


Freivalds 比较 算法 ( 见 参 考 文献 [8] )。 那 么 ,程序 计算 出 的 结果 相等 ， 而 实际 上 AB A C 的 概率 有 
多 大 呢 ? 如 果 计 算 以 4 为 模 ， 错 误 的 最 大 概率 是 1/4。 这 个 概率 在 多 次 重复 测试 后 可 以 变 得 极 小 。 











以 下 代码 产生 错误 的 概率 已 经 低 至 104 量 级 。 





from random import randint 
from sys import stdin 


def readint(): 
return int(stdin.readline() ) 


def readarray(typ): 
return list(map(typ, stdin.readline().split())) 


def readmatrix(n): 
M= [] 
for _ in range(n): 
row = readarray (int) 


assert len (row) == n 
M. append (row) 
return M 


def mult (M, v): 
n = len (M) 
return[sum(M[i] [j] * v[j] for j in range(n)) for i in range(n)] 


def freivalds (A, B, C): 
n = len (A) 





x = [randint(0, 1000000) for j in range (n)] 
return mult (A, mult (B, x)) == mult (C, x) 
LE name == " main me 
n = readint() 
A = readmatrix(n) 
B = readmatrix (n) 
C = readmatrix(n) 
print (freivalds(A, B, C)) 











1.3.2 ”显示 格式 


程序 的 输出 必须 使 用 print 命令 ， 它 会 根据 你 提供 的 参数 生成 一 个 新 的 行 。 行 尾 的 换行 符 可 
以 通过 在 参数 中 传递 end=" 取消 掉 。 为 显示 指定 小 数位 数 的 浮 点 数 ， 可 以 使 用 % 运算 符 ， 方 法 为 
“格式 % (EL. SiS HATES BE YS i 个 值 蔡 换 。 以 下 例子 显示 了 一 行 格式 类 似 “Case 
#1: 51.10 Paris” 的 字符 串 : 


























| print ("Case #%i: %.02f %s" % (testCase, percentage, city)) | 

















在 上 面 例子 中 ，%i 被 整 型 变量 testCase 的 值 所 替换 ，%.02f 被 浮 点 型 变量 percentage 的 
值 所 替换 并 保留 两 位 小 数 ，%s 被 字符 串 型 变量 city 的 值 所 替换 。 











1.4 复杂 度 


要 想 写 出 高 效率 的 程序 ， 必 须 先 找到 一 个 具有 合适 复杂 度 的 算法 。 复 杂 度 取决 于 运算 时 间 和 输 
入 数据 大 小 之 间 的 关系 。 我 们 用 明道 表达 式 (大 0 符号 ) 来 表示 不 同 算法 的 复杂 度 。 假 设 输入 数据 
或 参数 的 长 度 为 x， 日 算法 的 运算 时 间 随 m 变化 ， 那 么 我 们 就 说 这 个 算法 的 复杂 度 是 O(n?)。 

对 于 两 个 正 值 函 数 f 和 gg， 如 果 存 在 正 实数 n,。 Me, WEA n> n 都 满足 fn) < ceg), 
则 我 们 借 此 定义 函数 之 间 的 关系 ， 并 简 记 为 feO(g)。 由 于 滥用 符号 ， 也 有 人 写 做 f= Ole). XP 
记 法 能 够 把 函数 了 中 的 乘法 常量 和 加 法 常量 抽象 出 来 ， 体 现 出 函数 运算 时 间 相 对 于 参数 长 度 的 
增长 速度 。 

同样 ， 对 于 常量 n, 和 c (ec > 0), WM FTA n = ny 都 能 够 满足 ftn) Z cegem, Wiet 
JER. WER feO(g) H fe Q(g), Witte fe O(g), ERAN f FI g 函数 拥有 相同 的 时 间 复 杂 度 。 

当 c 是 一 个 常量 日 算法 的 复杂 度 是 O(n’) 的 时 候 ， 我 们 说 这 个 算法 的 复杂 度 和 nn 成 多 项 式 时 间 
关系 。 当 一 个 问题 存在 一 种 算法 解 ， 而 且 解 的 复杂 度 是 多 项 式 时 间 的 时 候 ， 该 算法 就 是 一 个 需要 多 
项 式 时 间 解 决 的 问题 。 这 类 问题 有 一 个 专门 的 名 字 叫 作 了 P 问题 *。 遗 憾 的 是 ,不 是 所 有 的 问题 都 存在 
多 项 式 时 间 解 。 还 有 大 量 问题 ， 人 们 尚未 找到 任何 能 够 在 多 项 式 时 间 内 解决 的 算法 。 

其 中 一 个 问题 是 布尔 可 满足 性 问题 (k-SAT ) : 给 定 n 个 布尔 型 变量 和 m 条 语句 ， 每 条 语句 包 
含 x 个 符号 (每 个 符号 代表 一 个 变量 或 其 逆 值 变量 )， 是 否 有 可 能 为 每 个 变量 赋 一 个 布尔 值 ( 真 或 
假 )， 使 得 每 条 语句 包含 至 少 一 个 值 为 真 的 变量 ? (SAT 是 布尔 可 满足 性 问题 中 语句 对 符号 数量 没 
有 限制 的 版 本 。) 每 一 个 单独 问题 ”的 特殊 性 在 于 , 我 们 能 够 在 多 项 式 时 间 内 通过 评估 所 有 条 件 ,， 验 
证 一 个 潜在 的 解 ( 变量 赋值 ) 能 和 否 满足 以 上 所 有 限制 。 当 以 上 条 件 被 满足 的 时 候 ， 这 类 问题 有 个 专 



































































































































DQ 在 计算 复杂 度 理论 中 ,P 是 在 复杂 度 类 问题 中 可 于 决定 性 图 灵机 以 多 项 式 量 级 或 称 多 项 式 时 间 求 解 
的 决定 性 问题 。 译 者 注 
@ 大 取 不 同 值 的 时 候 。 译 者 注 
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门 的 名 字 叫 作 NP 问题 "。 我 们 可 以 很 容易 在 多 项 式 时 间 内 解决 1-SAT， 因 此 1-SAT 问题 属于 了 问 
题 。2-SAT 同样 也 属于 了 问题 ， 我 们 将 在 6.10 节 验 证 它 。 但 从 3-SAT 开始 ， 我 们 就 不 确定 了 。 我 们 
只 知道 解决 3-SAT 问题 的 难度 至 少 和 SAT 问题 的 难度 相当 。 

HEPC NP， 直 观看 来 ， 如 果 我 们 能 找到 一 个 多 项 式 时 间 复 杂 度 的 解 ， 那 就 一 定 可 以 找到 
一 个 非 定常 多 项 式 时 间 复 杂 度 的 解 。 人 们 认为 P NP, 但 目前 这 个 推测 仍然 得 不 到 证 实 。 在 证 实 
之 前 ， 人 研究 者 们 把 NP 问题 简化 ， 把 问题 A 的 多 项 式 时 间 算 法 解 转化 为 问题 B 的 解 。 如 此 一 来 ， 如 
果 A 问题 属于 P 类 ,那么 B 问题 也 同样 属于 了 类 一 一 A 问题 的 难度 和 B 问题 的 难度 “至 少 是 相同 
的 "。 至 少 和 SAT 难度 相同 的 问题 集合 构成 了 一 个 问题 的 类 别 ， 即 NP 困难 问题 。 它 们 中 有 一 部 分 
既是 NP 困难 问题 ， 又 属于 NP 问题 ， 那 么 这 些 问 题 则 属于 NP 完全 问题 。 无 论 是 谁 ， 只 要 能 在 多 
项 式 时 间 内 解决 其 中 一 个 问题 ， 就 可 以 解决 所 有 其 他 问题 。 而 这 个 人 也 会 被 历史 铭记 ， 同 时 得 到 
百 万 美元 的 奖金 。 目 前 ， 为 了 在 可 接受 的 时 间 内 解决 这 些 问题 ， 挑 战 者 必须 专注 于 那些 有 助 于 解 
决 问题 的 方向 和 领域 (如 图 的 平面 性 问题 )， 或 者 让 程序 能 用 稳定 的 概率 返回 结果 ， 或 者 提出 接近 
最 优 解 的 解决 方案 。 幸 和 运 的 是 ,那些 在 编程 竞赛 中 可 能 遇 到 的 问题 总 体 来 说 都 是 多 项 式 时 间 复 杂 度 
问题 的 。® 

在 个 人 编程 竞赛 中 ， 参 赛 者 的 程序 必须 在 几 秒 钟 内 给 出 结果 ， 这 只 留 给 处 理 器 执行 上 千 万 或 上 
亿 次 运算 的 时 间 。 表 1.1 给 出 了 针对 不 同 的 输入 数据 长 度 ， 以 及 在 1 秒 钟 内 给 出 结果 的 算法 的 可 接 
受 时 间 复 杂 度 标准 。 要 注意 ， 这 些 数字 取决 于 编程 语言 ”和 执行 程序 的 硬件 设备 ， 以 及 要 执行 的 运 
算 类 型 ， 如 整数 运算 、 浮 点 数 运算 或 调用 数学 函数 。 
























































































































































表 1.1 
输入 数据 长 度 ”可 接受 的 复杂 度 
1000000 O(n) 
100000 O(n log n) 
1000 O(n?) 


我 们 请 读者 用 简单 程序 做 一 个 实验 ， 测 试用 不 同 的 n 值 做 n 次 乘法 所 需要 的 运算 时 间 。 我 们 坚 
持 认 为 ， 在 朗 道 表 达 式 中 ,那些 隐藏 常量 值 也 可 能 非常 重要 ， 而 且 有 时 在 实践 中 ， 算 法 的 渐进 时 间 
复杂 度 越 大 ， 就 越 有 可 能 成 功 。 举 个 例子 ， 当 计算 两 个 nxn 阶 矩 阵 乘 法 的 时 候 ， 贪 梦 算 法 需要 
O(n) 次 运算 ， 然 而 Strassen 发 现 了 一 个 只 需要 O(n) 次 运算 的 递归 算法 ( 见 参 考 文献 [26] )。 但 对 
于 实际 要 进行 的 矩阵 运算 ， 贪 禁 算 法 显然 更 加 有 效率 。 

在 Python 中 ， 在 列表 中 添加 一 个 元 素 所 需要 的 时 间 是 一 个 常数 ， 同 样 ， 访 问 一 个 指定 下 标 

















DQ 非 定 常 多 项 式 时 间 复 杂 性 类 ， 包 含 了 可 以 在 多 项 式 时 间 内 ， 对 于 一 个 判定 性 算法 问题 的 实例 ， 一 个 
给 定 的 解 是 否 正确 的 算法 问题 。 一 一 译 者 注 

Q 如果 读者 对 算法 复杂 度 相 关 问 题 感 兴趣 ， 推 荐 阅读 :《 可 能 与 不 可 能 的 边界 : PNP 问题 趣 史 》 AR 
邮电 出 版 社 ，2014 年 。 一 一 编者 注 

© 大 致 上 ，C++ e Java 语言 快 2 倍 时 间 ， 比 Python 快 4 倍 时 间 。 
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的 列表 元 素 所 需要 的 时 间 也 是 一 个 常数 。 新 建 一 个 列表 的 工 记 门 子 列表 所 需要 的 时 间 是 
O(max{1, j-i})”. Python 语言 中 的 字典 型 数据 通过 散 列 表 (hash table ) 来 表示 和 存储 ， 在 最 坏 
情况 下 ， 访 问 一 个 键 所 需要 的 时 间 是 线性 的 〈 由 字典 中 键 的 数量 决定 )， 但 实际 上 ， 访 问 时 间 一 
般 是 常数 。 然 而 ， 这 个 常数 时 间 是 不 能 忽略 的 ， 所 以 ， 如 果 字 典 的 键 值 是 0 到 -1 的 整数 ， 最 
好 使 用 列表 性 能 。 

对 于 某 些 数据 结构 ， 我 们 使 用 分 挫 时 间 复 杂 度 。 比 如 在 Python 中 ， 一 个 列表 在 内 部 是 用 表格 
来 展现 的 ， 并 有 一 个 大 小 属性 。 当 用 append 方法 将 一 个 新 元 素 加 入 列表 的 时 候 ， 它 会 被 加 入 到 表 
格 的 最 后 一 个 元 素 之 后 ， 列 表 大 小 属性 加 1。 如 果 表 格 的 容量 不 足以 添加 新 元 素 ， 则 会 分 配 一 个 内 
存 空间 是 原 表格 大 小 2 售 的 新 表格 ， 并 把 原 表 格 内 容 复 制 进来 。 同 样 ， 当 对 一 个 空 列表 连续 执行 n 
次 append 命令 时 ， 每 次 执行 时 间 有 时 是 常量 ， 有 时 是 与 列表 大 小 相关 的 线性 值 。 但 这 些 append 
方法 的 执行 时 间 仍 然 在 O(n) 级 别 ， 因 为 每 次 执行 操作 可 以 分 挫 一 个 0(1) 级 别 的 常量 时 间 。 
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我 们 将 首先 讲述 高 效 编程 的 核心 内 容 一 一 程序 解决 问题 的 基础 ， 即 数据 结构 。 

抽象 类 型 是 关于 一 系列 对 象 的 规范 ， 它 归纳 了 对 象 可 以 取 的 值 、 可 以 执行 的 操作 以 及 操作 的 具 
体内 容 。 我 们 也 可 以 把 一 个 抽象 类 型 理解 为 对 象 的 统一 规格 。 

数据 结构 是 根据 统一 规格 的 定义 ， 为 高 效 处理 特 定数 据 而 总 结 出 的 具体 数据 组 织 方式 。 
此 ， 我 们 可 以 使 用 一 个 或 多 个 数据 结构 来 实现 一 个 抽象 类 型 ， 并 设 定 每 个 操作 的 时 间 复 杂 度 和 
所 需 内 存 。 如 此 一 来 ， 根 据 操作 被 执行 的 频率 ， 我 们 会 选择 某 一 种 抽象 类 型 的 实现 方式 来 解答 
不 同 问题 。 

为 了 更 好 地 编写 程序 ， 必 须 掌 握 编程 语言 和 标准 库 所 提供 的 数据 结构 。 在 下 面 几 节 中 ， 我 们 来 
讲解 一 下 苋 赛 中 最 实用 的 数据 结构 。 


1.5.1 栈 


Be (stack ) 是 把 元 素 组 织 起 来 并 提供 如 下 操作 的 对 象 (图 1.2 ) : 测试 一 个 栈 是 否 为 空 ， 在 其 顶 
部 添加 一 个 元 素 ( 入 栈 )， 从 顶部 访问 并 删除 一 个 元 素 ( 出 栈 ) Python 语言 的 基本 类 型 列表 (list) 
实现 了 栈 。 我 们 使 用 append (element) 方法 执行 人 栈 操作 ,使 用 pop O 方法 执行 出 栈 操作 。 如 
果 一 个 列表 被 用 于 布尔 运算 ， 比 如 一 个 if while 语句 中 的 条 件 测试 , 语句 当 且 仅 当 它 非 空 的 时 
修 值 为 真 。 此 外 ， 其 他 所 有 实现 了 __len ”方法 的 对 象 也 是 如 此 。 以 上 所 有 操作 需要 的 时 间 都 是 
一 个 常数 。 
































































































































O 跟 子 列表 本 身 的 长 度 有 关 。 译 者 注 
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图 1.2 Python 语言 中 三 种 主要 的 访问 序列 数据 结构 


15.2 FH 


字典 能 采用 表格 和 下 标的 方式 把 键 和 值 关联 起 来 。 其 内 部 运行 方式 以 散 列表 结构 为 基础 ， 散 列 
表 结 构 使 用 散 列 算法 把 元 素 与 表 中 的 某 个 下 标 关 联 ， 并 在 多 个 元 素 与 同一 个 下 标 关 联 的 时 候 实 现 冲 
突 处 理 机 制 。 在 最 好 的 情况 下 ， 字 上 典 的 读 、 写 操作 时 间 都 是 常数 。 但 在 最 坏 的 情况 下 ， 所 需 时 间 是 
线性 的 , 因为 系统 必须 顺序 访问 一 系列 键 和 值 ,以便 处 理 冲突 "“。 在 实际 应 用 中 , 最 坏 的 情况 很 少 发 
生 。 在 本 书 中 ， 我 们 总 体 上 都 假设 访问 一 个 字典 元 素 的 时 间 是 常数 。 如 果 键 值 的 形式 为 0 1,…， 
n-1， 我 们 通常 建议 使 用 简单 的 表 结 构 而 不 是 字典 ， 令 程序 效率 更 高 。 






































1.5.3 ”队列 


队列 与 栈 类 似 ， 差 别 仅 在 于 向 队列 里 添加 元 素 时 ， 元 素 被 加 到 尾部 ( 入 队 )， 而 提取 元 素 时 则 
从 队列 头 部 开始 (出 队 )。 这 种 机 制 也 称 作 FIFO (first in, first out， 先 进 先 出 )， 就 像 排 队 一 样 ; 而 
栈 则 被 称 作 LIFO (last in, first out， 后 进 先 出 )， 就 像 驳 一 堆 盘 子 一 样 。 

在 Python 的 标准 库 中 ， 有 两 个 类 实现 了 队列 。 第 一 是 Queue 类 ， 这 是 一 个 同步 实现 ， 意 味 
着 多 个 进程 可 以 同时 访问 同一 个 对 象 。 由 于 本 书 的 代码 不 涉及 并 发 机 制 ， 我 们 不 推荐 使 用 这 个 
类 ， 因 为 它 在 执行 同步 的 时 候 使 用 的 信号 机 制 会 拖 慢 执行 速度 。 第 二 是 Deque 类 (Double 
Ended Queue， 即 双向 队列 )， 除 了 提供 标准 方法 ， 即 在 尾部 使 用 append (el nt) 添加 
元 素 和 在 头 部 使 用 popleft () 提取 元 素 之 外 ， 它 还 提供 了 额外 方法 ， 用 于 在 队列 头 部 使 用 
appendleft (element) 添加 元 素 和 在 尾部 使 用 pop () 提取 元 素 。 我 们 把 这 种 队列 称 作 双 向 队 
列 。 这 种 更 复杂 的 数据 结构 将 在 8.2 节 详 细 说 明 : 在 路 径 权 重 是 0 和 1 的 图 中 查找 最 短路 径 算法 
中 ， 这 种 结构 非常 有 用 。 

我 们 推荐 使 用 Deque 类 。 但 为 了 举例 说 明 ， 以 下 代码 展示 了 如 何 使 用 两 个 栈 实现 一 个 队列 的 
方式 。 一 个 栈 作为 队列 头 部 ， 用 于 提取 元 素 ， 另 一 个 栈 作 为 队列 尾部 用 于 插 人 元 素 。 当 作为 头 部 的 
栈 为 空 的 时 候 ， 它 会 与 作为 尾部 的 栈 相互 替换 。 通 过 len (q)， len _ 方法 能 获取 队列 q 中 的 
元 素数 量 ， 并 通过 if q 测试 队列 是 否 为 空 。 幸 运 的 是 ， 这 些 操作 所 需 时 间 都 是 常数 。 



















































































DQ 顺序 访问 所 有 拥有 同一 个 下 标 或 散 列 值 的 键 ， 直 到 找到 需要 的 对 象 。 


译 者 注 





class OurQueue: 
def init__(self): 


self.in_ stack = [] # 队列 的 尾部 
self.out_stack = [] # 队列 的 头 部 


def len (self): 


return len(self.in stack) + len(self.out_stack) 


def push(self, obj): 
self.in stack.append (obj) 


def pop(self): 


if not self.out stack: + 队列 头 为 空 
self.out_stack = self.in_stack[::-1] 


self.in_stack = [] 
return self.out_stack.pop() 

















1.5.4 优先 级 队列 和 最 小 堆 








优先 级 队列 是 一 个 抽象 类 型 数据 ， 能 够 添加 元 素 ， 并 取出 键 数字 最 小 的 那个 元 素 。 在 生成 哈 夫 
曼 编 码 ( 见 10.1 节 ) 和 在 图 中 找到 两 个 点 的 最 短路 径 (UL 8.3 节 Dijkstra 算法 ) 时 ， 利 用 优先 级 队 





列 对 一 个 数组 进行 排序 ( 用 堆 排序 算法 )， 十 


堆 的 数据 格式 类 似 于 一 棵 树 。 
。 满 二 又 树 和 完全 二 又 树 





分 有 用 。 优 先 级 队列 通常 是 通过 堆 的 方式 来 实现 的 ， 








如 果 一 棵 二 又 树 的 所 有 叶子 节点 与 根 节 点 之 间 的 距离 都 相同 ， 则 二 又 树 被 称 作 满 二 叉 树 。 如 果 
一 棵 二 又 树 的 所 有 叶子 节点 最 多 位 于 两 层 ， 所 有 浅 层 叶 子 节 点 全 满 ， 而 最 深层 的 叶子 节点 集中 在 最 
左边 ， 这 就 是 一 棵 完全 二 叉 树 。 使 用 数组 可 以 很 容易 表示 这 样 的 树 形 结构 ( 图 1.3 )。 这 棵 树 下 标 为 











0 的 元 素 被 忽略 ， 根 节点 的 下 标 是 1， 节 点 i 




















两 个 子 节点 是 2i 和 2i+1。 利 用 简单 的 计算 即 可 操作 





和 遍历 这 棵 树 。 在 第 10 章 中 ， 有 其 他 表示 树 形 结构 的 数据 结构 。 








0 1 2 3 4 5 


6 7 8 9 10 11 12 


图 1.3 ”一 棵 使 用 数组 结构 表示 的 完全 二 义 树 
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© 优先 级 队列 和 堆 

HE (heap) 是 一 个 能 检查 元 素 优先 级 的 反 转 树 状 结构 。 假 如 每 个 节点 的 键 值 (也 就 是 优先 级 ) 
比 其 子 节 点 小 ,， 那 这 就 是 一 个 最 小 堆 。 最 小 堆 根 节点 的 键 值 一 定 是 堆 中 最 小 的 一 个 。 同 样 也 存在 最 
大 堆 的 概念 ， 即 每 个 节点 的 键 值 都 比 其 所 有 子 节 点 的 键 值 要 大 。 

人 们 通常 更 感 兴趣 的 是 二 叉 堆 ， 即 完全 二 又 树 。 这 类 数据 结构 能 在 对 数 时 间 内 提取 最 小 元 素 和 
插入 新 元 素 。 总 的 来 说 ， 这 里 所 讲 的 是 有 一 定 顺 序 关 系 的 元 素 集合 。 堆 也 能 更 新 一 个 元 素 的 优先 
级 ， 在 使 用 Dijkstra 算法 寻找 一 条 向 顶端 的 最 短路 径 时 ， 这 个 操作 非常 有 用 。 

在 Python 语言 中 ， 堆 排列 是 用 heapqa 模块 实现 的 。 这 个 模块 提供 了 把 数组 转化 成 堆 的 方法 ， 
即 hneapify (table)。 而 转化 后 的 数组 仍 是 前 面 提 到 的 完全 二 叉 树 ， 唯 一 的 区 别 是 其 根 节点 下 标 
为 0 的 元 素 非 空 。 这 个 模块 同样 可 以 插入 一 个 新 元 素 ， 即 heappush (heap, element), WAH 
出 最 小 元 素 ， 即 heappop (heap) 。 

相反 ，heapq 模块 不 能 修改 堆 中 的 元 素 值 ， 而 这 个 操作 在 Dijkstra 算法 中 可 以 优化 时 间 复 杂 
度 。 因 此 ， 我 们 推荐 下 面 更 完整 的 实现 方式 。 

实现 的 细节 

相关 结构 包含 了 heap 数组 结构 ， 储 存 着 一 个 纯粹 意义 上 的 堆 ; 结构 中 还 包含 一 个 zank 字 典 ， 
用 于 查找 堆 中 元 素 的 下 标 。 主 要 操作 是 push 和 pop。 当 用 push 方法 插入 一 个 新 元 素 时 ， 元 素 被 
当 作 堆 中 最 后 一 个 叶子 节点 加 入 ,然后 ， 堆 会 根据 其 排序 规则 重新 组 织 。 使 用 pop 方法 可 以 提取 
最 小 元 素 ， 根 节点 被 堆 的 最 后 一 个 叶子 节点 所 替换 ， 然 后 堆 会 再 次 根据 自身 规则 重新 组 织 。 图 1.4 
展示 了 这 一 过 程 。 

操作 ”len _ 返回 堆 的 元 素数 量 。 这 个 操作 通过 Python 隐 式 地 把 一 个 堆 转 换 成 一 个 布尔 值 ， 
kan, EHE n 非 空 的 时 候 ， 可 以 将 while n 这 样 的 判断 语句 作为 继续 循环 的 条 件 。 

堆 的 平均 复杂 度 是 O(logn)， 但 在 最 差 情况 下 ， 由 于 使 用 了 字典 rank, 复杂 度 会 增加 到 O(n). 



























































































































































, G) 
onde 


图 1.4 pop 操作 移 除 并 返回 堆 的 数值 2， 并 用 末端 的 叶子 节点 15 BR. A 
后 down 操作 执行 一 系列 交换 ， 将 15 移动 到 符合 堆 规则 的 位 置 





© 图 中 是 一 个 最 小 堆 ， 其 中 每 个 节点 的 键 值 一 定 小 于 其 所 有 子 节点 ， 因 此 会 根据 此 规则 执行 替换 。 
译 者 注 








class OurHeap: 


def init__(self, items): 
self.n = 0 
self.heap = [None] # index 0 会 被 替换 


self.rank = {} 
for x in items 
self.push (x) 


def len (self 
return len (self. heap) - 


def push (self, x): 
assert x not in self.rank 
i = len(self.heap) 


























self.heap.append (x) 添加 一 个 新 的 叶子 节点 

self.rank[x] = i 

self.up (i) 保持 堆 排 请 

def pop(self): 

root = self.heap[1] 

del self.rank[root] 

x = self.heap.pop() t 移 除 最 后 一 个 叶子 节点 

if self: + JES 
self.heap[1] = # 移动 到 根 节点 
self.rank[x] = 1 
self.down (1) # 保持 堆 排序 





return root 


堆 的 重新 组 织 通过 up (i) 和 down (i) 操作 实现 : 当 一 个 下 标 为 i 的 元 素 比 其 父 节点 小 ， 此 时 
用 up 操作 ; 当 元 素 比 了 则 用 down 操作 。 因 此 ，up 操作 让 某 节 点 完成 与 其 父 
系列 交换 ， 直 到 满足 堆 的 规则 。 而 down 操作 的 效果 类 似 ， 用 于 节点 及 其 子 节点 的 交换 。 

def up(self, i): 


x = self.heap[i] 
while i > 1 and x < self.heap[i // 2]: 






































self.heap[i] = self.heap[i // 2] 
self.rank[self.heap[i // 2]] =i 
i (f= 2 
self.heap[i] = x # 找到 了 插入 点 
self.rank[x] = i 


def down (self, i): 
x = self.heap[i] 
n = len(self.heap) 
while True: 
left=2* i # 在 二 叉 树 中 下 降 
right = left + 1 
if right < n and \ 
self.heap[right] < x and self.heap[right] < self.heap[left]: 
self.heap[i] = self.heap[right] 
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self.rank[self.heap[right]] = i # 提升 右 侧 子 节点 
i = right 
elif left < n and self.heap[left] < x: 
self.heap[i] = self.heap[left] 
self.rank[self.heap[left]] = i # 提升 左 侧 子 节点 
i = left 
else: 
self.heap[i] 
self.rank[x] 
return 





x # 找到 了 插入 点 


def update(self, old, new): 
i = self.rank[old] # 交换 下 标 为 i 的 元 素 
del self.rank[old] 
self.heap[i] = new 
self.rank[new] = i 
if old < new: # 保持 堆 排序 
self.down (i) 
else: 
self.up (i) 








155 “并 查 集 


° 定义 

JAR ( Union-find ) 这 种 数据 结构 存储 了 一 系列 V 字形 集合 (分 片 )， 并 能 完成 一 些 指定 操 
作 。 这 些 操作 在 动态 数据 结构 中 也 被 称 为 查询 。 

— find (v) 返回 元 素 v 所 在 集合 内 的 一 个 特定 元 素 。 如 果 想 检验 元 素 u 和 元 素 v 是 否 在 同一 

个 集合 中 ， 只 需 比 较 find(u) 和 fing (v)。 

— union (u, v) 合并 分 别 包含 u M v 的 两 个 集合 。 
e 应 用 

这 种 数据 结构 主要 应 用 于 检测 图 的 元 素 连 通 性 ( 见 6.6 节 )。 每 次 添加 路 径 都 调用 一 次 union 
和 find， 以 此 测试 两 个 顶点 是 否 在 同一 个 集合 中 。 并 查 集 还 可 用 于 Kruskal 算法 对 最 小 生成 树 的 
判断 ( 见 10.4 节 )。 


数据 结构 对 每 个 查询 所 需 的 时 间 基 本 为 常 
我 们 把 集合 中 的 有 向 树 元 素 指 n (A115). + v 元 素 有 一 个 指向 树 中 更 高 层级 
节点 的 引用 parent[v]。 根 节点 v 是 集合 的 特定 元 素 ,在 en 中 用 一 个 特殊 值 来 标注 ， 我 们 可 以 
选择 0 或 -1， 或 在 值 相关 情况 下 选择 v 元 素 本 身 。 整 个 元 素 的 大 小 保存 在 数组 length[v] P, P v 
是 特定 元 素 。 在 这 个 数据 结构 中 有 两 个 概念 。 
1， 当 朝向 根 节点 侦 历 一 个 元 素 的 时 候 ， 我 们 将 借 机 压缩 路 径 ， 也 就 是 说 ， 把 遍历 路 径 上 的 所 
有 节点 直接 挂 在 根 节点 上 。 
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2， 当 执行 合并 操作 union 的 时 候 ， 我 们 把 序列 最 低 的 树 挂 在 阶 最 高 的 树 的 根 节 点 上 。 一 棵 树 
的 阶 指 的 是 在 树 没 有 被 压缩 时 ， 本 应 有 的 深度 。 


aa © 

QO OD Q PQS 

Y ot o 
‘MS 


415 AR: 并 查 集 结构 包含 两 个 集合 {7, 8, 2} 和 (2, 3, 4,5, 6,9, 


10, 11}. AR: 


当 执行 操作 find(10) 时 ， 指 向 根 节 点 的 路 径 上 的 所 有 节点 都 直接 指向 根 


节点 5。 这 种 机 制 对 将 来 执行 节点 的 find 操作 有 加 速 作用 


于 是 我 们 得 到 如 下 代码 : 








class UnionFind : 


def 


def 


def 


__init__ (self, n): 
list (range (n) ) 
[0] 


self.up = 
self.rank = xn 
find(self, x): 
if self.up[x] 

return x 
else: 


== x: 


self.up[x] = self.find(self.up[x]) 


return self.up[x] 


union(self, x, y): 
l£f.find (x) 
lf.find(y) 


if repr x == repr y: 


repr_x = se 


repr y = se 


U 


# 已 在 同一 个 集合 














return False 


if self.rank[repr_x] == self.rank[repr_y]: 





self.rank[repr_x] += 1 
self.up[repr_y] = repr x 
elif self.rank[repr_x] > self.rank[repr_y]: 
self.up[repr y] = repr x 
else: 7 E 
self.up[repr_x] = rept y 


return True 
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可 以 证 明 ， 对 于 一 个 大 小 为 n WES, En munion I find 操作 所 需要 的 时 间 复 杂 度 都 
是 O((mtn) a(n)), JEt} a Œ Ackermann 函数 的 反 函 数 ， 一 般 可 以 视 为 常量 4。 





1.6 ”技术 


1.6.1 比较 


在 Python 语言 中 ， 元 组 比较 采用 字典 序 。 例 如 ， 这 种 方式 能 找到 一 个 数组 中 的 最 大 元 素 ， 同 
时 还 能 找到 它 的 下 标 ， 当 有 重复 值 的 时 候 取 最 大 的 下 标 。 


max((tab[i], i) for i in range (len (tab))) 



































举例 来 说 ， 为 了 找到 一 个 数组 中 的 多 数 元 素 (majority element )， 我 们 可 以 用 字典 来 统计 每 个 
元 素 的 出 现 次 数 ， 并 用 以 上 代码 来 选择 其 中 的 多 数 元 素 。 这 种 实现 方式 的 平均 时 间 复 杂 度 是 O(n 有 ; 
而 在 最 差 情况 下 ， 由 于 使 用 了 字典 ， 时 间 复 杂 度 是 Omko HP n 是 给 定 输入 的 单词 数量 ， 而 是 
一 个 单词 的 最 大 长 度 。 

这 里 顺便 讲 一 下 ， 字 典 数 据 类 型 的 使 用 方式 存储 键 值 对 (key, value)。 一 个 空 字典 用 { } 来 表示 。 
测试 一 个 字典 中 是 否 存在 键 的 方法 是 in 和 not in。 下 面 代 码 中 的 for 循环 可 以 遍历 字典 中 所 有 
的 键 来 完成 查找 。 
def majority(L): 

compute = {} 

for word in L: 

if word in compute: 
compute [word] += 1 


else: 
compute [word] = 1 













































































valmin, argmin = min((-compute[word], word) for word in compute) 








return argmin 





1.6.2 ”排序 


Python 语言 中 包含 n 个 元 素 的 数组 排序 的 时 间 复 杂 度 是 O(nlogn)。 排 序 分 为 以 下 两 种 。 

一 sort () 排序 : 这 个 方法 会 直接 修改 被 排序 的 列表 内 容 ， 称 为 “ 原 地 ”修改 。 

一 sorted () 排序 : 这 个 方法 会 返回 相关 列表 的 一 个 排 好 序 的 副本 。 假 设 包含 n 个 整数 的 数组 
工 ， 我 们 想 在 其 中 找到 两 个 差 值 最 小 的 整数 。 为 了 解决 这 个 问题 ， 可 以 先 对 数组 工 进行 排序 ， 
然后 对 其 进行 遍历 ， 最 终 找 到 数值 最 接近 的 两 个 整数 。 使 用 min 方法 结合 字典 排序 法 ， 可 以 
找到 集合 中 的 多 组 整数 对 。 同 样 ，valmin 变量 包含 着 数组 工 中 两 个 连续 元 素 的 最 小 差 值 
〈 即 数组 工 中 两 个 值 最 近 的 数 的 差 值 ) ; argmin 变量 则 是 这 两 个 数 中 较 大 一 个 数 的 下 标 。 
























































def closest _values(L): 
assert len(L) >= 2 














L.sort () 

valmin, argmin = min((L[i] - L[i - 1], i) for i in range(1, len(L))) 

return Li[argmin - 1], Llargmin] 

在 最 差 情 况 下 ， 对 个 元 素 排序 所 需 的 时 间 复 杂 度 是 Q (nlogn)。 为 了 证 明 这 一 点 ， 我 们 假设 有 


一 个 包含 n 个 不 同 整 数 的 数组 。 算 法 必须 在 n! 种 可 能 序列 中 找到 一 种 排 好 的 序列 。 每 次 比较 会 返 
回 两 种 可 能 中 的 一 个 值 ( 更 大 或 更 小 )， 并 把 结果 空间 切 分 为 两 部 分 。 最 终 ， 在 最 坏 情况 下 ， 需 要 
[log;(n!)] 次 比较 才能 找到 这 个 特定 序列 ， 从 而 得 到 复杂 度 的 下 限 Q (og(n!))= Q (nlogn)。 
e 变种 

在 某 些 情况 下 ， 我 们 可 以 在 O(n) 时 间 内 对 一 个 包含 个 整数 的 数组 进行 排序 。 比 如 ， 一 个 数 
组 内 的 所 有 整数 全 部 在 0 到 cn 范围 内 ， 其 中 c 是 任意 实数 。 我 们 只 需 遍历 输入 ， 在 一 个 大 小 为 cn 
的 数组 count 中 计算 每 个 元 素 的 出 现 次 数 ， 然 后 使 用 下 标 降序 遍历 count， 就 可 以 得 到 一 个 包含 了 0 
到 cn 的 值 的 输出 数组 。 这 种 排序 方法 称 为 “计数 排序 ”( counting sort )。 

















1.6.3 扫描 


众多 几何 学 问题 都 可 以 用 扫描 算法 来 解决 。 许 多 关于 区 间 Cinterval )， 也 就 是 一 维 几 何 对 象 的 
问题 也 一 样 。 扫 描 算法 旨 在 从 左 往 右 地 遍历 输入 元 素 ， 并 对 每 个 遇 到 的 元 素 做 特定 处 理 。 











e 例子 : 区 间 交 又 

对 于 给 定 的 个 区 间 [7;, 7)， 其 中 i= 0,…, n-1， 我 们 希望 找到 一 个 x 值 ， 它 被 最 多 的 区 间 包 括 。 
以 下 是 一 个 时 间 复 杂 度 为 O(nlogn) 的 解决 方案 。 我 们 把 所 有 极限 值 一 起 排序 ， 然 后 用 一 个 假想 的 指 
Sb x 从 左 到 右 遍 历 这 些 极限 值 ， 再 用 一 个 计数 需 来 记录 只 看 到 起 始 值 却 看 不 到 终止 值 的 区 间 的 数 
量 ， 于 是 ， 最 后 这 个 区 间 数 量 就 包含 了 xo 

注意 ，B 元 素 的 处 理 顺序 保证 了 每 个 区 间 的 终止 值 在 区 间 的 起 始 值 之 前 得 到 人 处理， 这 对 我 们 处 
理 的 右 侧 半 开放 区 间 的 情况 非常 必要 。 














def max _interval_intersec (S): 
B = ([(left, +1) for left, right in S] + 
[(right, -1) for left, right in Si) 
B.sort() 
c= 0 
best = (c, None) 
for x, din B; 
ct=d 
if best [0] < cè 
best = (c, x) 
return best 
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16.4 AZTIA 


我 们 在 这 里 要 介绍 一 种 构成 贪 禁 算 法 的 主要 算法 技巧 。 笼 统 来 说 ， 这 种 算法 在 寻找 解决 方 
案 的 每 个 步骤 中 都 选择 了 一 个 让 局 部 结果 最 大 化 的 参数 。 比 较 正 式 的 说 法 是 ， 这 种 算法 通过 拟 
阵 组 合 结 构 ， 能 够 证 明 贪 禁 算法 的 优化 和 不 优化 程度 。 我 们 在 本 节 就 不 对 此 展开 讨论 了 ( 见 参 
考 文献 [21] )。 

e 例子 : 最 小 点 积 

我 们 使 用 一 个 简单 的 例子 来 介绍 这 种 算法 。 对 于 两 个 给 定 的 向 量 x 和 y， 它 们 均 由 个 正 整 数 

或 空 组 成 ， 首 先 需 找到 一 种 元 素 的 排列 x{1,…, n} ， 使 得 》 xy.) 最 小 。 


















































e@ 应 用 

假设 以 映射 方式 将 n 项 任务 交 给 n 个 工人 完成 ， 也 就 是 说 ,每 项 任务 必须 分 别 分 配给 不 同 的 工 
人 。 每 项 任务 都 有 一 个 完成 小 时 数 ， 每 个 工人 都 有 一 个 按 每 小 时 计算 的 工资 数 。 目 标 是 ， 找 到 一 种 
排列 方式 ， 使 得 支付 给 工人 的 工资 总 数 最 少 。 


e 时 间 复 杂 度 为 O(nlogn) 的 算法 

既然 最 佳 解决 方案 是 对 x 和 y 采用 同一 种 排列 ， 在 不 失 普 适 性 的 情况 下 ， 我 们 可 以 假设 x 已 经 
按 升 序 排列 好 。 假 设 有 一 个 答案 把 x 和 一 个 最 大 元 素 尹 相 乘 ， 对 于 下 标 上 且 当 方 雯 多 时 ， 有 一 个 
定 排序 x， 使 得 x(0) = i A alk) =j。 我们 会 发 现 ，xoy; + xw 大 于 或 等 于 xoy + xiy;， 这 意味 着 ， 
在 没有 额外 成 本 的 情况 下 , 可 以 变换 为 x。 乘 以 y,。 证 明 过 程 如 下 ， 注意 这 里 的 xy A x, 都 是 正 数 























rl 

















Xo Sx, 


Xo; — Si )< Xx- y) 
XV; — XV; S XY XY; 
Xj + XY; S Xoy; + Xj. 
通过 重复 操作 截断 参数 ， 从 x 中 截断 出 向 量 x， 并 从 yj 中 截断 出 向 量 y， 我 们 发 现 ， 当 i 一 
yo 是 yo 为 逆序 的 时 候 ， 结 果 最 小 。 





























def min scalar prod(x, y): 
x = sorted(x) # 得 到 排 好 序 的 副本 
y = sorted(y) + 提前 准备 参数 
return sum(x[i] * y[-i - 1] for i in range (len (x))) 














1.6.5 ”动态 规划 算法 


动态 规划 算法 如 同 程 序 员 随 刁 携带 的 瑞士 军刀 ， 是 一 项 必 备 的 工具 。 其 思路 是 把 问题 分 解 成 若 
于 子 问 题 ， 并 基于 子 问题 的 解决 方案 找到 原始 问题 的 最 优 解 。 
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一 个 经 典 例 子 就 是 计算 斐 波 那 契 数列 第 二 个 数 的 算法 。 斐 波 那 契 数列 以 如 下 递归 方式 定义 : 
F(0)=0 
F(1)=1 
F(i) = F(i-1) + F(i-2) 
比如 在 我 们 扑 楼 梯 的 时 候 ， 这 个 算法 可 以 计算 在 一 次 登 上 1 或 2 级 台阶 的 情况 下 ， 登 上 n 级 台 
阶 有 多 少 种 走 法 。 使 用 递归 方式 计算 所 效率 很 低 ， 因 为 对 于 相同 的 参数 i，F(i) 需要 进行 多 次 计算 
(图 1.6 )。 而 以 动态 规划 算法 作为 解决 方案 时 ， 只 需 简单 地 把 FO) 到 F(n) 的 数值 储存 在 一 个 大 小 为 
n+ 1 的 数组 中 ， 并 按照 下 标 升序 填充 数组 。 如 此 一 来 ， 在 计算 FO 时 ，FGC-D 和 F(i-2) 的 值 已 经 
被 计算 好 ， 并 存储 在 数组 相应 的 位 置 上 。 


Fa 


























Kf 


图 1.6 左边 使 用 树 状 结构 的 穷 举 法 实现 斐 波 那 契 数列 F(4) 的 计算 过 
程 。 右 边 采 用 动态 规划 算法 计算 依赖 值 ” 的 方式 构成 了 一 个 
有 向 无 环 图 ， 大 幅 减 少 了 节点 数量 “ 


166 ”用 整数 编码 集合 


这 是 一 种 用 一 群集 合 编 成 整数 的 高 效 算法 , 集合 中 元 素 都 是 介 于 0 至 的 63 UE O 范围 内 的 整 
数 。 更 准确 地 说 ， 是 使 用 二 进 制 转换 的 方式 把 子 集 编码 成 特征 向 量 。 编 码 方式 如 下 表 所 示 。 
























































D 即 计算 FGi) 时 候 的 F(i-1) 和 F(i-2). 译 者 注 

© 左 图 中 每 个 非 叶子 节点 的 值 都 是 通过 两 个 子 节点 的 值 计算 得 米 ， 相 同 值 的 节点 被 多 次 重复 计算 ; 而 
右 图 采用 动态 规划 算法 ， 每 个 节点 仅 需 被 计算 一 次 ,减少 了 重复 计算 的 次 数 。 译 者 注 

© 这 个 数字 是 来 自 Python 的 整数 。 由 于 Python 的 整数 一 般 存 储 在 一 个 机 器 字 中 ， 而 这 个 机 器 字 的 长 度 
如 今 一 般 是 64 个 二 进 制 位 。 
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Hz 1.2 
值 表达 式 解释 
{} 0 空 集 
{i} 1<<i 这 个 值 代 表 27 
{0,1,---.n-1} (<<n)—-1 2"”-1=204+2 +--+ 27] 
AUB A|B 管道 运算 符 | 代表 二 进 制 或 
ANB A&B 与 运算 符 & 代表 二 进 制 与 
(A\B) U(B\A) AB 按 位 异 或 运算 符 " 代表 异 或 
ACB A&B==A 测试 是 否 包含 
TEA (1<<ij& A ”测试 是 否 属于 集合 
{min A} -A&A 如 果 4 为 空 ， 此 表达 式 值 为 0 








有 用 。 但 不 存在 等 价 算式 来 获取 集合 的 最 大 值 。 
我 们 来 看 一 个 经 典 问题 如 何 应 用 这 一 编码 技巧 。 


获取 用 整数 编码 的 集合 {3, 5, 6} 中 的 最 小 值 ， 这 个 整数 是 22+25+2s=104。 






































64+32+8=104 01101000 
104 的 补 数 10010111 ( 每 位 二 进 制 取 反 ) 
-104 10011000 
-104&104 = 8 00001000 ( 两 个 二 进 制 数 按 位 与 ) 























结果 是 22， 从 而 找到 单元 素 集 {3} 


图 1.7 获取 集合 的 最 小 值 





e 例子 : 平均 分 三 份 
定义 











图 1.7 中 给 出 了 最 后 一 个 表达 式 的 证 明 过 程 。 这 个 表达 式 在 循环 计算 一 个 集合 的 基数 ” 


时 非常 


假设 有 个 整数 xwzx:， 现 要 把 这 些 数 平 均 分 配 到 3 个 集合 中 ， 且 每 个 集合 中 的 整数 和 相同 。 


穷 举 方式 时 间 复 杂 度 为 0(2”) 的 贪 梦 算法 











思路 是 枚 举 所 有 不 相交 子 集 4, BEC {0…, n-1}， 并 比较 f(4)、f(B8)、f(O)， 其 中 C= 10, 
ALAS) =D), Kio 这 种 实现 方式 不 需要 维护 和 比较 C SE A, ite HIE f(A) = f(B) E 3f(A) = 








A{0,…%…, n-1})o 


n-1}\A\B 





def three partition(x): 
f = [0] * (1 << len (x)) 
for i in range (len (x)): 
for S in range(1 << i): 
fis | (1 << i)] = £[S] + x[i] 
for A in range(1 << len(x)): 
for B in range(1 << len(x)): 
if A & B == 0 and f[A] == f[B] and 3 * f[A] == f[-1]: 
return(A, B, ((1 << len(x)) -1) ^A ^ B) 





return None 








译 者 注 


O 即 集合 中 包含 元 素 的 个 数 。 











这 种 算法 还 有 另 一 种 应 用 : 使 用 四 则 运算 来 计算 指定 值 ( 见 15.5 节 )。 
1.6.7 “二 分 查找 


e 定义 
假设 /是 一 个 布尔 函数 ， 即 值 在 {0, 1} 范围 内 的 函数 ， 且 有 如 下 规律 : 
AKOS <fn-1)=1 
现在 要 找到 最 小 的 实数 使 得 RK) = 1。 


e 时 间 复 杂 度 为 O(logn) 的 算法 

在 一 个 区 间 [1, 有 ] 中 查找 ， 起 初 1= 0, h= n-1。 然 后 用 区 间 的 中 间 值 m = [(7+ A)/2] 来 测试 函 
Bef. 根据 前 面 的 计算 结果 ， 查 找 空间 缩小 为 [7, aes hlo XÈ, EIE m 的 时 候 向 下 取 整 
这 样 ， 第 二 个 区 间 就 永远 不 会 为 空 ， 第 一 个 区 间 也 是 。 在 logn] 次 迭代 后 ， 即 查找 区 间 缩小 为 音 
元 素 的 时 候 ， 查 找 会 结束 。 


def discrete binary search(tab, lo, hi): 
while lo < hi: 
mid = lo + (hi - lo) // 2 
if tab[mid]: 
hi = mid 


























else: 
lo = mid + 1 
return lo 











e 类 库 

Python 标准 模块 bisect 中 提供 了 二 分 查找 算法 ， 所 以 在 某 些 情况 下 ， 我 们 不 需要 自己 来 实现 。 
假设 有 一 个 数组 tab， 由 个 已 排序 好 的 元 素 组 成 。 现 在 要 为 新 元 素 x 找到 插入 点 了， 那么 需要 执行 
bisect_left(tab, x, 0, n), 而 其 返回 值 就 是 第 一 个 满足 tab[i] 三 x 的 数组 元 素 的 下 标 io 





























o 连续 域 
这 种 技术 同样 可 以 用 在 以 下 情况 : 函数 /的 区 间 为 连续 ， 且 和 希望 找到 最 小 值 x。， 使 得 对 于 所 有 
x 三 x6。， 都 有 f(x)= 1。 此 时 ， 时 间 复 杂 度 取决 于 x 需要 的 精确 度 。 














def continuous binary search(f, lo, hi): 
while hi - lo > le-4: | 这 里 设 定 精确 度 
mid = (lo + hi) / 2. 人 eee? 
if f( (mid): 
hi = mid 








else: 
lo = mid 








return lo 











DO 插入 的 位 置 要 满足 排序 规则 。 译 者 注 
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© 无 上 界 的 连续 域 查找 

假设 /是 一 个 单调 布尔 函数 ，K0) = 0， 且 保证 存在 整数 n， 使 得 ftn) = 1。 最 小 的 整数 n 使 得 
Aino) = 1， 即 使 不 存在 查找 所 需要 的 上 限 ， 也 可 以 在 时 间 O(logno) 内 找到 m”. HH, BATE n = 1; 
当 ftn)=0 时， 我们 把 n 翻 倍 。 一 旦 找到 整数 使 得 fn)= 1 时 ， 我 们 就 采用 通常 的 二 分 查找 方法 。 


e 三 分 查找 

假设 函数 f 在 {0,…, n-1} 区 间 内 先 递 增 ， 后 递减 ， 而 我 们 要 找到 其 中 的 最 大 值 。 在 这 种 情况 
F, PARKE [1, A] 拆 分 成 三 块 ， 即 [1, aj, [a+1, b] F [b+1, h]， 这 样 比 拆 成 两 块 更 简单 。 通 过 比 
BE fla) Fl f(b) 的 值 ， 可 以 判断 [7,5] 和 [atl, A] 中 的 哪个 区 间 包 含 要 找 的 最 大 值 。 这 种 算法 需要 的 迭 
(EEX log, no © 


e 在 区 间 (0, 2) 中 的 查找 

如 果 查 找 区 间 的 大 小 n 是 2 的 寄 ， 仅 使 用 位 操作 中 的 位 移 运算 和 异 或 运算 ， 就 可 以 对 普通 二 分 
查找 进行 少许 优化 。 我 们 从 数组 的 最 后 一 个 元 素 的 下 标 开始 。 这 个 元 素 的 二 进 制 格式 是 长 度 为 左 的 
一 列 1。 对 于 每 个 要 测试 的 三 进 制 位， 我 们 把 它 替 换 成 0O， 即 可 得 到 用 于 遍历 整个 数组 的 下 标 i， 而 
测试 tab 四 的 真 伪 ， 即 可 完成 查找 。 



























































def optimized binary search(tab, logsize): 
hi = (1 << logsize) - 1 
intervalsize = (1 << logsize) >> 1 
while intervalsize > 0: 
if tab[hi * intervalsize]: 
hi *= intervalsize 
intervalsize >>= 1 








return hi 





o ima 
PP ESE ELA A BRL f, EFENA, EIA. BROCE 
比 函数 /简单 许多 ， 当 给 定 一 个 值 x 的 时 候 ， 我 们 可 以 借 它 来 完成 对 flo) 的 计算 。 其 实 ， 只 要 找到 
最 小 值 》 使 得 广 0) > x MATT 
。 例子 : AREK 
某 个 连通 容器 系统 由 个 瓶 壁 高 度 不 同 的 容器 互相 连通 组 成 ， 我 们 想 计 算 将 系统 的 液 位 提升 到 
一 个 指定 高 度 所 需 注入 的 水 量 。 或 者 ， 假 设 向 系统 中 注入 体积 为 二 的 液体 ， 想 确定 系统 的 液 面 高 











DQ HA BALAI BAAR BA, RWWA RBA HAA 0 增加 到 1, AA BH, to Rn 是 使 
ftno)=1 Ma, TARABA RKE An >m, Afn)=1, Lm Fon, 间 的 所 有 值 n, 都 有 
ftn,)=1， 这 就 很 容易 找到 mo。 一 一 译 者 注 

© 注意 ， 比 较 fla) fb) 后 迭代 查找 的 区 间 不 是 最 开始 拆 分 开 的 左 、 中 、 右 三 个 区 间 中 的 一 个 ， 而 是 
左 二 中 或 中 十 右 两 个 区 间 中 的 一 个 。 画 个 图 就 很 容易 理解 了 。 一 一 译 者 注 

© 这 里 还 是 在 说 找 单调 函数 里 面 最 小 最 大 值 的 问题 。 译 者 注 








度 ， 可 以 使 用 以 下 方式 ” 





level = continuous binary search(lambda level: volume(level) >= V, 0, hi) 











1.7 建议 


我 们 在 这 里 给 出 一 些 建议 ， 帮 助 读 考 更 快 解决 算法 问题 ， 并 写 出 正确 的 程序 。 首 先 ， 要 学 会 有 
组 织 、 成 体系 地 思考 。 为 此 ， 一 定 不 要 在 尚未 清楚 理解 题目 的 所 有 细节 之 前 ， 仅 赁 一 时 冲动 就 开始 
编写 程序 。 如 果 你 在 拿 起 键盘 之 前 先 冷静 地 审视 一 下 ， 就 不 会 轻易 犯 下 某 些 错误 ， 和 否则 ， 你 很 容易 
写 出 一 个 根本 无 法 实现 的 方案 。 

如 果 有 可 能 ， 最 好 在 竞赛 时 把 读 题 和 解 题 的 时 间 分 开 。 多 给 自己 一 点 时 间 。 在 程序 代码 的 注释 
中 添加 问题 描述 ， 如 果 有 可 能 ， 再 加 上 题目 的 URL， 并 明确 指出 算法 的 时 间 复 杂 度 。 在 一 段 时 间 
后 ， 当 你 回头 再 看 自己 编写 的 程序 时 ,一 定 会 欣赏 这 种 做 法 。 尤 其 ， 这 能 让 程序 代码 保持 逻辑 严 
密 、 结 构 紧 竣 。 尽 量 使 用 题目 中 提 到 的 名 词 ， 以 便 显示 答案 和 题目 的 相关 性 ， 因 为 没有 什么 比 调试 
变量 名 更 没有 实际 意义 、 更 让 人 难受 的 事情 了 。 


o 好 好 读 题 

什么 样 的 时 间 复 杂 度 可 以 被 接受 ? 

注意 题目 中 提出 的 限制 ， 在 实现 你 的 算法 之 前 做 好 复杂 度 分 析 。 

输入 数据 是 否 有 条 件 、 有 保证 ? 

不 要 从 题目 的 例子 中 猜测 条 件 。 不 要 做 任何 猜测 。 如 果 题 目 中 没有 说 明 “ 图 是 非 空 的 "， 那 么 
某 些 测试 用 例 中 就 有 可 能 包含 空 的 图 。 如 果 题 目 中 没有 说 “字符 串 不 包含 空格 ”， 那 么 就 可 能 有 一 
个 测试 用 例 包 含 这 样 的 字符 溃 。 

使 用 什么 样 的 数据 类 型 ? 

整数 还 是 浮 点 数 ? 数字 是 否 有 可 能 是 负 值 ? 如 果 你 使 用 Java 或 C++ 写 程序 ， 注 意 要 确定 中 间 
变量 的 上 限 值 ， 选 择 使 用 16 位 、32 位 或 64 位 的 整数 。 

哪 道 问题 更 简单 ? 

对 于 一 个 需要 完成 几 个 问题 的 竞赛 ， 你 应 当 在 开始 时 快速 浏览 所 有 题目 ， 分 析 每 道 题目 的 类 
型 ， 是 贪 梦 算法 、 隐 式 图 还 是 动态 规划 算法 ?而 后 评估 题目 的 难度 。 把 精力 集中 在 那些 最 简单 且 优 
先 级 最 高 的 题目 上 。 在 团体 竞赛 的 时 候 ， 要 根据 每 个 参赛 者 的 专业 程度 来 分 配 题目 。 留 意 其 他 队伍 
的 进度 ， 也 能 帮 你 发 现 容易 解决 的 简单 题目 。 



























































































































































© 这 里 调用 的 continuous binary search 方法 是 在 前 文 “连续 域 查找 ”中 定义 的 ， 可 以 理解 为 
先 往 容器 系统 中 倾倒 液体 ， 多 了 就 减 半 再 试 ， 少 了 就 加 一 半 再 试 ， 直 到 找到 符合 精确 度 的 液体 量 。 
译 者 注 
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e 做 好 计划 

比较 题目 的 例子 

画 纲要 图 。 找 到 待 解决 问题 与 已 知 问题 之 间 的 关联 ， 如 何 利用 实例 的 特殊 性 ? 

如 果 可 能 ， 利 用 类 库 

掌握 经 典 的 二 分 查找 算法 、 排 序 和 字典 等 类 库 。 

使 用 题目 中 提 到 的 名 词 命名 变量 

名 词 越 简 短 、 表 述 越 清晰 越 好 。 

初始 化 变量 

确保 在 任何 新 测试 用 例 使 用 前 ， 所 有 变量 已 经 被 重新 初始 化 。 继 续 上 一 个 未 完成 的 
很 典型 的 错误 。 举 例 来 说 ， 一 个 程序 解决 了 图 的 问题 ， 输 入 中 包含 了 很 多 个 测试 用 例 。 
例 以 两 个 整数 开始 : 顶点 数量 n 和 道路 数量 m。 接 着 是 两 个 大 小 都 是 m 的 整数 组 4 M B 
了 每 个 用 例 中 道路 的 项 点。 假设 我 们 使 用 邻接 链表 来 编辑 一 个 图 ， 对 于 每 个 i = 0,…, m 
与 GLA] 相 加 ， 把 4[ 与 GBEN 相 加 。 如 果 链 表 没 有 在 每 次 读 和 人 测试 用 例 前 被 清空 
径 会 累积 在 一 起 ， 形 成 一 个 所 有 图 的 交集 。 
e 调试 

现在 犯错 

为 了 以 后 有 正确 的 反应 ”o 

设 定 和 测试 更 多 的 测试 用 例 

对 于 有 限制 条 件 的 情况 〈 裁 判 回复 “错误 答案 ”) ?和 输入 数据 很 多 的 情况 ( 裁判 回 
时 ”或 “运行 时 错误 ”) ?， 设 定 更 多 测试 。 





































































































解释 算法 

解释 自己 的 算法 ， 并 向 队友 评论 程序 。 你 必须 能 解释 清楚 每 一 行 代码 。 
简化 实现 

把 相似 代码 重新 组 织 和 重 构 。 

冷静 审视 

先 跳 转 到 另 一 道 问题 上 ， 然 后 回头 再 看 ， 以 获得 新 的 视角 。 

比较 





比较 你 的 本 地 开发 环境 和 要 运行 代码 的 服务 顺 环境 。 





D 平时 多 调试 ， 多 看 错误 信息 ， 积 累 定 位 错误 的 灵感 。 一 一 译 者 注 
Q ”此 时 一 般 没 有 检查 边界 条 件 。 一 一 译 者 注 
© 此 时 一 般 是 有 了 死 循环 和 除 0 错误 。 





译 者 注 


迭代 是 一 个 
每 个 测试 用 
， 其 中 保存 
-1, 48 B[i] 





» A PRI 


复 “ 答 题 超 


1.8 走 得 更 远 





以 下 推荐 的 作品 ， 能 帮 你 更 深入 地 理解 本 书 涉及 的 内 容 。 

o 基础 算法 :《 算 法 导论 (第 3 版 )》(TH. Cormen, C.E. Leiserson, R.L. Rivest, and C. Stein, The 
MIT Press: Cambridge, 2009)。 

更 特殊 算法 : Encyclopedia of Algorithms (Editors: Ming-Yang Kao, Springer Verlag, 2008)。 

流 算法 相关 深入 、 广 泛 的 研究 :《 网 络 流 : 理论 、 算 法 与 应 用 》(R.K. Ahuja, T.L. Magnanti and 
J.B. Orlin, Prentice Hall, 2011)。 

几何 算法 : Computational Geometry: Algorithms and Applications (M. de Berg, O. Cheung, M. 























van Krevel and M. Overmars, Springer Verlag, 2011). 
e 其 他 广 受 欢迎 的 参考 书 : Python Essential Reference (David M. Beazley, Pearson Education, 
2009) 和 《了 Python cookbook， 第 三 版 》( David M. Beazley, Brian K. Jones， 人 民 邮 电 出 版 社 ， 
2015 年 )。 
© 对 于 准备 竞赛 很 有 帮助 的 书 : Competitive Programming (Steven and Felix Halim, Lulu, 2013)。 
e 最 后 是 《算法 设计 指南 》( Steven S. Skiena, Springer Verlag, 2009 年 )。 
本 书 最 后 给 出 了 书 中 提 及 的 参考 文献 ， 其 中 包含 了 图 书 和 科研 论文 。 但 对 于 大 众 来 说 ， 论 文 并 
不 容易 接触 到 。 读 者 可 以 通过 Google Scholar 或 在 大 学 图 书馆 里 尝试 寻找 这 些 文献 的 原文 。 
阅读 本 书 有 时 需要 配合 使 用 网 站 tryalog.org/index-en。 在 这 里 ， 读 者 不 但 能 找到 本 书 中 编写 的 
Python 程序 ， 还 能 找到 测试 用 例 的 文件 。 当 然 ， 这 些 程序 和 文件 也 可 以 在 Github 和 PyPI 仓库 中 找 
到 ， 在 Python 3 环境 下 使 用 命令 pip install tryalgo 就 可 以 一 步 安 装 。 
























































字符 串 处 理 是 算法 领域 里 非常 重要 的 内 容 ， 其 中 有 些 是 关于 文字 处 理 的 ， 比 如 语法 检查 ， 有 些 
则 关于 子 字符 串 〈 子 串 ) ;或 者 更 笼统 地 说 ， 是 关于 模式 (pattern ) 查找 的 。 随 着 生物 信息 学 的 发 
展 ， 出 现 了 DNA 序列 问题 。 本 章 中 将 介绍 一 系列 我 们 认为 的 重要 算法 。 

在 计算 机 系统 内 ， 一 个 字符 串 可 以 用 一 个 字符 的 列表 来 表示 。 但 一 般 情况 下 ， 我 们 会 使 用 str 
类 型 ， 这 个 类 型 在 Python 语言 中 类 似 于 一 个 列表 。 对 于 使 用 Unicode 编码 方式 的 字符 串 ， 每 个 字符 
可 以 使 用 两 个 字 节 来 编码 。 一 般 情况 下 ， 字 符 仅 用 一 个 字 节 表示 ， 并 用 ASC 码 来 编码 : 0 ~ 127 
的 每 个 整数 代表 一 个 不 同 的 字符 ， 编 码 按 顺 序 排列 ， 如 0 ~ 9, a~z, A~Z~ 同样 ， 如 果 一 个 字 
符 串 只 包含 大 写字 母 ， 我 们 可 以 使 用 ord(s[ij - ord('A') 这 样 的 计算 方式 找到 第 i 个 字符 在 字母 表 中 
的 位 置 。 反 过 来 说 , 第 j 个 (从 0 开始 编号 ) 大 写字 母 可 以 使 用 chr(tord('A’)) 找到 。 

说 到 子 串 , 也 就 是 字符 串 的 子 字符 串 的 时 候 , 一 般 要 求 字符 必须 是 连续 的 2, 这 与 更 通常 的 子 序 
Bl (FF) 的 定义 不 同 。 

























































































2.1 易 位 构 词 


e 定义 
如 果 对 调 字符 ， 使 得 单词 w 变 成 单词 v， 那么 w 就 是 v 的 易 位 构 词 。 假 设 有 一 个 集合 包含 了 n 
个 最 大 长 度 为 上 的 单词 ， 现 在 要 找到 所 有 的 易 位 构 词 。 


输入 : le chien marche vers sa niche et trouve une limace de chine nue pleine de malice qui lui fait du 




















charme 


输出 : {fune nue}, {marche charme}, {chien chine niche}, {malice limace}. 








© 即 中 间 没 有 空格 。 译 者 注 
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句子 的 意思 是 :“ 一 条 狗 走 向 狗 窜 时 遇 到 一 条 顽皮 的 鼻涕 虫 ， 被 吸引 了 过 去 ”其 中 某 些 单词 ， 
如 chien ( 狗 ) 和 mniche ( 3 ), limace ( 鼻涕 虫 ) 和 malice (ME) 等 ， 都 是 字母 相同 而 顺序 不 同 
的 单词 ， 输 出 得 到 的 是 输入 句子 中 所 有 易 位 构 词 的 集合 。 


° 复杂 度 





以 下 算法 能 在 平均 时 间 OCzlog 朋 内 解决 问题 。 而 在 最 坏 情况 下 ， 


复杂 度 是 O(n?Hogh)。 


。 算法 








由 于 使 用 了 字典 ， 所 需 时 间 








算法 的 思路 是 计算 每 个 单词 的 签名 。 两 个 单词 能 得 到 相同 的 签名 ， 当 且 仅 当 它们 互 为 易 位 构 
词 。 这 个 签名 不 过 是 包含 了 相同 字母 的 另 一 个 单词 ， 是 把 要 计算 签名 的 单词 中 的 所 有 字母 按 顺 序 排 


列 后 得 到 的 。 





算法 使 用 的 数据 结构 是 一 个 字典 ， 








将 每 








个 签名 与 拥有 这 一 签名 的 所 有 单词 的 列表 对 应 起 来 。 





def anagrams (w): 


d= {} 


s= 
if s iñ d: 


else: 
d[s] = 


reponse = [] 
for s in d: 


return reponse 





w = list(set(w) ) 


# -- 提取 易 位 构 词 


if len(d[s]) 
reponse. append ([w[i] 


for i in range (len(w) ): 
'' Join (sorted (w[i]) 


d[s] .append (i) 


> 1z 


for i in d[s]]) 


He 


删除 重复 项 
保存 有 同样 签名 的 单词 





+ 





Ers 
a 


名 


+ 忽略 没有 易 位 构 词 的 词 











2.2 T9: 9 个 按键 上 的 文字 


输入 :2665687 


输出 : bonjour 


e 应 用 























按键 式 移动 电话 提供 了 一 种 有 趣 的 输入 方法 ,通常 被 称 作 T9 输入 法 。26 个 字母 分 布 在 数 


字 2 一 9 的 按键 上 ， 就 像 





图 2.1 展示 的 一 样 


。 为 了 输入 一 个 单词 ， 只 需 按 对 应 的 数字 键 就 可 以 了 。 








但 是 ， 有 时 输入 一 个 相同 的 数字 序列 却 可 能 
最 有 可 能 出 现 的 单词 ， 并 把 这 些 单词 摆 放 在 候选 词 的 首位 。 

















得 到 不 同 的 单词 。 在 这 种 情况 下 ， 就 需要 用 字典 来 推测 
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这 个 问题 实例 的 第 一 部 分 是 一 个 字典 结构 ， 由 一 系列 键 值 对 (m, w) 组 成 ， 其 中 m 是 一 个 由 26 
ge ww 是 这 个 单词 的 权重 。 问题 实例 的 第 二 部 分 由 输入 序列 为 
2 一 9 的 数字 组 成 。 对 于 每 个 输入 序列 ， 只 需要 显示 字典 中 权重 最 高 的 一 个 单词 。 假 设 有 一 个 数字 
序列 使 用 T9 输入 法 ， 根 据 图 2.1 中 的 对 应 关系 ， 输 出 单词 为 m， 而 输入 数字 序列 + 是 通过 将 单词 m 
中 的 每 个 字母 都 蔡 换 为 相关 数字 得 来 的 。* 是 输入 数字 序列 1 的 前 级 ， 这 时 ， 我 们 就 可 以 定义 单词 
m 与 s 相关 。 比 如 单词 bonjour (你 好 ) 与 数字 序列 26 相关 ， 也 和 数字 序列 266 或 2665687 相关 。 
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1 2 3 
4 5 6 
PQRS TUV WXYZ 
7 8 9 
i 0 # 














图 2.1 一 个 移动 电话 键盘 上 的 按键 


e 复杂 度 为 O(nk) 的 算法 

字典 初始 化 的 时 间 复 杂 度 为 O(nk)， 而 每 次 查询 的 时 间 复 杂 度 为 Ok) KEA n 是 字典 中 的 单 
词 数量 , 上 是 单词 长 度 的 上 限 。 

在 第 一 时 间 ， 对 于 字典 中 某 个 单词 的 每 个 前 级 p, REER p es 前 级 的 所 有 单词 的 总 权 
重 ,， 并 把 总 权重 存 人 一 个 freq (频率 ) 字典 中 。 接 下 来 ,我 们 在 男 一 个 字典 prop [seq] 中 存储 
赋予 每 个 给 定 的 seq T 遍历 freq 中 的 所 有 键 ， 可 以 定 权重 最 天 的 前 组 。 此 处 的 
关键 就 是 word_code 函数 ， 它 能 为 给 定单 词 提供 相关 的 输入 数字 序列 。 

为 方便 阅读 ， DIF SE Re Scant TLS AH 是 Onko 


t9 = "22233344455566677778889999" 
# 分 别 对 应 abcdefghijklmnopqrstuvwxyz 这 26 个 字 



















































































def letter digit(x): 
assert 'a' <= x and x <= 'z' 
return t9[ord(x)-ord('a') ] 


def word code (words) : 




















return ''.join(map(letter digit,words) ) 
def predictive text (dico): # dico 意 为 字典 
freq = {} # freqip] = HARA p 的 单词 的 总 权重 


























QO 这 里 可 以 理解 为 ， 每 次 用 T9 输入 法 输入 一 个 新 数字 的 时 候 ， 由 于 尚未 输入 完成 ， 输 入 数字 序列 的 前 
几 个 数字 就 是 整个 输入 序列 的 前 缓 。 译 者 注 











for words,weights in dico: 
prefix = "™" 
for x in words: 
prefix += x 
if prefix in freq: 
freq[prefix] += weights 
else: 
freq[prefix] = weights 
# prop[s] = 输入 s 时 要 显示 的 前 级 
prop = {} 
for prefix in freq: 
code = word code (prefix) 
if code not in prop or freq[prop[code]] < freq[prefix]: 
prop[code] = prefix 
return prop 


def propose(prop, seq): 
if seq in prop: 
return prop[seq] 
else: 
return "None" 











2.3 ”使 用 字典 树 进 行 拼写 纠正 


° 应 用 

如 何 把 单词 存 人 一 个 字典 来 纠正 拼写 呢 ? 对 于 某 个 给 定 的 单词 ， 我 们 希望 很 快 在 字典 中 找到 一 
个 最 接近 的 词 。 如 果 把 字典 里 的 所 有 单词 存在 一 个 散 列 表 里 ， 单 词 之 间 的 一 切 相近 性 信息 都 将 丢 
失 。 所 以 ， 更 好 的 方式 是 把 这 些 单词 存 人 字典 树 ， 字 典 树 也 叫 前 绥 树 或 排序 树 (trie tree )。 






























































° 定义 
一 棵 保存 了 某 个 单词 集合 的 树 称 为 字典 树 。 连 接 一 个 节点 及 其 子 节 点 的 弧 线 用 不 同 字 母 标 注 。 
因此 ,字典 中 的 每 个 单词 与 树 中 从 根 节点 到 树 节点 的 路 径 相关 。 每 个 节点 都 是 标记 ， 用 于 区 分 相关 








字母 组 合 究 竞 是 字典 中 的 单词 ， 还 是 字典 中 单词 的 前 级 (图 2.2 )。 


Eo o> 


3 总 of O OS at 


图 2.2 ”字典 树 
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字典 树 存 储 着 法 语 单词 as、port、pore、pr&、pres 和 prêt ( 但 没有 重音 符号 )。 图 中 的 虚线 圈 
表示 子 节点 "; 实 线圈 代表 字典 中 一 个 完整 的 单词 。 右 边 是 一 个 前 缀 树 代表 的 相同 字典 >。 


e 拼写 纠正 

利用 上 述 数据 结构 ， 我 们 很 容易 在 字典 中 找到 一 个 与 给 定单 词 距离 为 dai st 的 单词 。 这 里 的 距 
离 以 编辑 距离 (levenshtein distance ) KEX, AG 3.2 节 有 详细 介绍 。 查 找 方式 是 只 需 模拟 每 个 节 
点 的 拼写 操作 ， 然 后 使 用 参数 dist-1 进行 递归 调用 。 
e 变种 

若 某 个 节点 只 有 一 个 子 节点 ， 就 可 以 合并 多 个 节点 ， 这 种 结构 更 精简 。 这 种 节点 用 单词 标记 ， 
而 不 是 用 字母 标记 。 图 2.2 右 侧 的 结构 更 节省 内 存 和 遍历 时 间 ， 被 称 为 前 组 树 ( patricia trie )。 









































from string import ascii letters # 在 Python2 中 需要 引用 letters 库 











class Trie Node: 
def init (self): 
self.isWord = False 
self.s = {c: None for c in ascii letters} 


def add(T, w, i=0): 
if T is None: 
T = Trie Node() 


if i == len(w): 
T.isWord = True 
else: 
T.s[w[i]] = add(T.s[w[i]], w, i + 1) 
return T 
def Trie(S): 
T = None 


for w in S: 
T = add(T, w) 
return T 


def spell check(T, w): 
assert T is not None 
dist = 0 
while True: # 尝试 用 越 来 越 长 的 距离 来 查找 
u = search(T, dist, w) 














if u is not None: 
return u 
dist += 1 


def search(T, dist, w, i=0): 
if i == len(w): 














D 这 个 路 径 的 字母 组 合 只 是 一 个 正确 拼写 的 单词 前 级 。 一 一 译 者 注 
D 右 侧 的 树 合并 了 只 有 一 个 子 节点 的 路 径 ， 经 过 优化 的 结构 更 简洁 ， 效 率 更 高 。 





译 者 注 





if T is not None and T.isWord and dist 
return "" 
else: 
return None 
if T is None: 
return None 
f search(T.s[w[il], 
if f is not None: 
return w[i] + f 
if dist == 0: 
return None 
for c in ascii letters: 
f search (T.s[c], 
if f is not None: 
return c + f 
下 search (T.s[c], 
if f is not None: 
return c + f 
return search(T, dist - 1, w; 


# 相关 


dist, w, i + 1) 


dist - 1, w, i) # 插入 


dist - 1, w, i+ 1) 


+ AR 





+ 删除 


i + 1) 








2.4 KMP ( Knuth-Morris-Pratt ) 模式 匹配 算法 


输入 : lalopalalali lala 
输出 : 
。 定 义 
给 定 一 个 长 度 为 n 的 字符 串 s 和 一 个 长 度 为 m 的 待 匹 配 模式 字 
第 一 次 出 现时 的 下 标 i。 当 不 是 s 的 子 串 时 ， 返 回 值 应 该 是 -1。 
SRE: O(ntm)， 见 参考 文献 [19]。 
。 穷 举 算法 
这 种 算法 用 来 测试 所 有 +t 在 s H 
m-1] 相关 。 最 坏 情况 下 的 时 间 复 杂 度 是 Onm) FI 


A 





FA 





和 1， 我 们 希望 找到 1 在 s 























i 演示 了 使 用 穷 举 算法 的 对 比 查找 过 程 。 每 一 




















对 应 选择 的 一 个 i， 并 用 字母 标识 出 在 选 定 i 时 的 相关 字符 ， 若 字符 不 相关 就 用 x 来 标记 。 
l a l o p a la l a li 
Oll a 1 x 
1 x 
2 1 x 
3 x 
4 x 
5 x 
6 l a l a 





PT AHH SLAY, FERRE RE, RAEES sli, i 


中 


十 


4 


行 
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在 处 理 ; 后 ， 我 们 能 了 解 字 符 串 s 的 大 部 分 内 容 。 利 用 这 些 信息 ， 就 不 必 对 例子 中 的 [0] 和 
s[1] 进行 比较 了 。 
e 算法 

我 们 把 两 个 字符 串 x My 的 重症 部 分 称 为 最 长 单词 ， 这 个 最 长 单词 既是 y 的 严格 后 级 ， 又 是 x 
的 严格 前 级 。 在 发 现 sli] 和 tj] 有 差异 的 时 候 ， 我们 把 1 向 s 的 尾部 移动 (从 0 到 i-1)， 以 便 进行 后 
续 比 较 。 由 于 s[0,…, 1] 的 前 绥 是 t[0…, j-1] (最 后 j 次 比较 已 经 证 明了 s[i-j,…, i-1] 和 +t[0,…, j-1] 
相等 )， 因 此 + 向 后 移动 的 距离 仅 由 1 来 决定 。 

我 们 可 以 通过 预先 计算 来 确定 t 向 后 偏 移 的 距离 。 用 x[ 四 来 记录 j 减 去 自身 与 [0, …, j-1] 的 重 
县 部 分 的 差 值 。 下 面 的 程序 展示 了 有 具体 实现 方式 。 为 了 分 析 复 杂 度 ， 我 们 把 计算 > 的 代码 和 字符 串 
匹配 的 代码 分 开 : 第 一 部 分 代码 的 复杂 度 是 0 (m)， 第 二 部 分 代码 的 复杂 度 是 9(0D)。 每 当 s[ = cf] 
时 ， 都 需要 把 7 增加 1;， 而 每 次 两 者 不 相等 的 时 候 ， 要 把 7 减少 1， 因为 zx 四 区 jo BEZ si] A ty] 最 
多 只 有 nn 次 相等 ,而 且 j 永远 是 非 负 值 ， 那 么 两 者 不 相等 的 次 数 最 多 也 只 有 n。" 





















































def knuth morris pratt(s, t): 
assert t l= '! 
len_s = len(s) 
len_t = len(t) 
r= [0] * lent 
j = r[0] = -1 
for i in range(1, len t): 
while j >= 0 and t[i - 1] != t[j]: 
J= e 
j += 1 
r[i] = 
j=0 
for i in range (len s): 
while j >= 0 and s[i] != t[j]: 
J= fj 
j += 1 
if j == lent: 
return i - lent + 1 
return -1 














QD 第 一 步 预 处 理 计算 了 带 匹 配 的 模式 字符 串 上 的 每 个 子 字符 串 的 最 大 前 缓和 后 缓 的 公共 元 素 长 度 ， 即 
1 本 身 包 含 的 重复 字符 和 字符 组 合 。 这 样 一 来 ， 每 次 匹配 失败 时 ， 带 匹配 字符 串 不 是 通过 简单 地 向 
后 移动 一 位 来 继续 查找 ， 而 是 根据 预先 算 好 的 前 级 和 后 级 的 公共 元 素 表 来 跳 过 一 定数 量 的 字符 ， 以 
此 直接 匹配 1 中 重复 的 字符 事 或 字母 组 合 ， 从 而 提高 效率 。 比 如 ， 字 符 事 1 是 ABCAD， 字符 事 s 是 
DEABCABABCADE, t 中 两 个 A 重复 出 现 ， 第 一 次 ABCAD 匹配 ABCAB 在 最 后 一 个 字符 D 和 B 
比较 时 失败 ， 此 时 ， 我们 准确 地 知道 匹配 失败 的 字符 DD 的 前 一 个 字符 A 匹配 成 功 了 ， 即 ABCA 都 匹 
配 成 功 了 ， 那 么 我 们 就 不 再 需要 比较 s 中 的 其 他 字母 。 也 就 是 说 ,不 是 将 1 中 的 A 和 s 中 的 B 比较 ， 
而 是 直接 用 已 经 匹配 成 功 的 1 中 的 A 来 和 s 中 的 A 对齐， 再 次 强调 ， 由 于 1 中 有 两 个 A 重复， 而 其 
他 字符 都 不 是 A， 那么 我 们 希望 匹配 s 中 的 A 时， 只 能 用 1 中 的 两 个 A 中 的 一 个 来 对 齐 s 中 的 A 
这 样 就 跳 过 了 一 定 不 相等 的 B 和 C 等 字符 。 一 一 译 者 注 


o 变种 

在 不 增加 复杂 度 的 情况 下 ， 增 加 一 个 很 小 的 改动 可 以 生成 一 个 大 小 为 n 的 布尔 型 数组 p， 它 指 
明了 对 于 每 个 位 置 i, 1 是否 是 s 在 i 位 置 的 一 个 子 串 。 概 括 地 说 ,我们 可 以 计算 出 一 个 整数 数 
组 p， 它 判断 了 对 于 每 个 位 置 i 是 否 有 最 大 的 j， 使 得 长 度 为 j 的 1 的 最 大 前 级 字符 串 是 s 在 i 结尾 的 
子 字符 串 。 这 个 算法 将 在 后 面 介绍 。 























2.5 ”最 大 边 的 KMP 算法 


查找 一 个 字符 串 的 最 大 边 ， 也 可 以 帮助 我 们 解决 字符 串 的 模式 匹配 问题 。 这 一 算法 的 基本 思想 
与 KMP 模式 匹配 算法 相同 ， 但 使 用 了 更 多 技巧 ， 因 此 实现 方式 也 更 简洁 。 
e 定义 

当 字 符 串 w 的 某 个 子 字符 串 同时 是 w 本 身 的 严格 前 级 和 严格 后 缀 时， 我们 把 该 子 字 符 串 称 作 
FP w 的 边 ， 且 将 最 大 边 记 为 pw) SARR, FIFE abababa 的 边 有 aba, a 和 空 字符 串 s。 
对 于 一 个 给 定 字符 串 w = wowo MEIE w 的 每 个 前 缀 的 最 大 边 ， 也 就 是 计算 这 些 边 
的 长 度 ， 因 为 w 的 前 缀 的 边 同 时 也 是 w 的 前 级 。 因 此 ， 我 们 也 可 以 快速 找到 前 级 长 度 的 序列 
L; = BW" Wi)|o 
e 关键 测试 

按照 边 的 思路 来 观察 一 个 递归 结构 : 假设 wu 是 v 的 边 ， 而 v 是 w 的 边 , 那么 zx 同时 也 是 w 的 
边 。 用 8 对 一 个 字符 串 w 进行 迭代 和 运算， 就 能 得 到 w 所 有 的 边 。 比 如 ， 对 于 w = abaababa， 可 以 得 
到 p(w)= aba, BBW) =a, UK PW)= eo 
° 算法 

假设 已 知 字符 串 w 的 前 i 个 前 级 的 最 大 边 ， 即 已 知 前 级 w= wowa (也 就 是 说 ， 子 字符 串 
wo,…, Wi, 拼接 而 成 的 字符 串 u )。 让 我 们 先 考虑 前 级 ux ( 更 明确 地 说 ,x 表示 字符 w): 其 最 大 边 
的 形式 一 定 是 vx， 其 中 v 是 w 的 边 (图 2.3)。 我们 用 v= piu) Ride FEB u 按 长 度 降序 排 
列 的 第 7 条 边 ， 并 用 三 来 记录 这 条 边 的 长 度 。 为 此 ， 要 从 最 大 边 = Pw) 开始 ,在 xz 的 边 的 
序列 (v) 中 寻找 v。 为 了 检测 一 个 已 经 是 ux 的 后 绥 的 候选 边 vx 是 否 是 ux 的 边 ， 只 需 确认 vx 
是 否 是 ux 的 前 级 即 可 。 然 而 ,既然 vy BAE u 的 前 级 ( 即 一 条 边 )， 那 么 只 需要 测试 紧 接 着 v 
后 续 ( 也 就 是 在 位 置 右 |v ) 的 字符 是 否 是 x。 这 就 又 回 到 了 测试 所, =?x 。 如 果 满 足 条 件 ， 那 么 
就 找到 了 pux) vx， 对 ux 的 最 大 边 计算 也 就 完成 了 。 和 否则 ， 就 要 测试 下 一 条 va po), HAKEN 
ka =L=] BO Wy) |= ly ， 因 为 vw 恰恰 是 w 的 前 缀 且 长 度 为 如 。 如 果 任 何 比较 都 没有 得 到 
想 要 的 结果 ， 就 可 以 确认 pux) = s。 因 为 在 每 次 迭代 中 ,我们 进行 的 唯一 一 次 测试 ， 也 就 是 计算 
4， 只 依赖 于 当前 的 边 长 。 算 法 的 实现 只 需 用 一 个 变量 来 确定 数组 Lo 
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ux u Xx 
Blu) 2 B(u) x 
B(ux ) v x v x 





























2.3 KMP 字符 串 匹 配 算法 变种 的 一 个 计算 步骤 





BEA 的 所 有 边 ， 我 们 就 知道 ux 的 最 大 边 形式 一 定 是 vx， 其 
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。 如 有 果 图 中 问 


hy 是 zx 的 边 


号 代替 的 字符 是 x, ABA v= Blw)， 否 则 就 要 在 pu) 更 短 的 边 中 查找 vo 

































































e BRE 
有 趣 的 是 ， 这 个 算法 的 复杂 度 呈 线性 下 降 : KRE, while 循环 迭代 的 次 数 永 远 都 不 会 超过 当 
KJE k, ee for 循环 中 最 多 只 增加 1. 
def maximum border length (w): 
n = len(w) 
L = [0] * (n + 1) 
for i in range(1, n) 
k = L[i] 
while w[k] != w[i] and k > 0 
k = L[k 
if w[k] == w[i]: 
L[i + 1] =k+ 1 
else: 
L[i + 1] = 0 
return L 
e 变种 
借助 最 大 边 的 列表 ， 我 们 能 解决 很 多 与 字符 串 和 单词 相关 的 问题 .计算 平方 子 串 ; 确定 回 文 前 
级 ; 判断 两 个 单词 x 和 y 是 否 共 恩 ， 也 就 是 说 ， 格 式 是 否 满足 对 于 单词 wu 和 v 有 x=w 且 y=vu; 检 
测 一 个 单词 x 的 最 小 周期 "， 即 单词 x 和 z 有 最 大 的 k 值 ， 令 z=x。 
e 关键 测试 
如 果 字 符 串 xz TAWE, W u 的 最 大 边 是 z+*!， 其 中 大 是 当 存 在 一 个 字符 z 并 使 得 u = z 成 立时 
的 最 大 整数 ( 图 2.4 )。 








def powerstring by border (u): 


L = maximum_border_length (u) 

n = len(u) 

if n % (n - L[-1]) == 0: 
return n // (n - L[-1] 

return 1 














QD 最 小 子 字 符 串 重复 的 最 多 次 数 即 为 最 小 周期 。 





译 者 注 





ula baabaaoba 











ile & a a hd oe 











abaaba 











图 2.4 已 知 一 个 周期 性 字符 串 u 的 最 大 边 ， 就 能 找到 其 最 小 周期 。 假 设 n 是 字符 
u 的 长 度 ， 如 果 n-l; 能 把 nn 整除， 那么 该 字符 串 就 是 周期 性 的 。 而 且 ， 
若 对 于 字符 z 有 w=z*， 那 么 其 中 外 的 最 大 值 是 n(n-) 


e WA: Es 中 匹配 模式 字符 串 t 

我 们 选择 一 个 字符 H, CEDE s 中 也 不 在 t 中 。 我 们 关注 的 是 字符 串 ts 的 前 绥 最 长 边 的 长 
E: 首先 要 注意 的 是 ， 因 为 存在 字符 #， 这 一 长 度 绝 对 不 会 超过 t 的 长 度 。 但 是 ， 每 当 该 长 度 达 到 
人 时， 说 明 我 们 在 s 中 找到 了 一 次 1 的 存在 。 因 此 ， 我 们 可 以 使 用 动态 规划 算法 确定 字符 串 ts 的 所 
有 带 有 前 级 的 列表 1.=|B(w)| (Al 2.5 )。 
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B(t#s) la baa a baa 


ejo o 1 11W: 23 2 32 :四 


图 2.5 查找 最 大 边 算法 的 一 次 迁 代 。t 在 s 中 每 出 现 一 次 ， 都 对 应 着 
在 最 大 边 1 的 长 度 列表 中 一 条 长 度 为 lt 的 边 

















。 备注 
所 有 编程 语言 的 标准 类 库 都 会 提供 一 个 在 字符 串 haystack 中 查找 模式 needle 的 方法 "。 在 


Java 8 中 ， 该 方法 在 最 坏 情况 下 的 时 间 复 杂 度 是 9 (nm)， 效 率 低 得 惊人 。 读 者 可 以 测试 一 下 ， 用 这 
个 方法 计算 当 变化 时 ， 在 字符 串 0” 中 查找 0"1 所 需 的 时 间 “。 











© 正如 在 草 堆 中 查找 一 根 针 。 一 一 译 者 注 
© 在 2n 个 0 构成 的 字符 囊 中 查找 n 个 0 拼接 一 个 1 的 字符 事 ,， 这 就 是 前 面 所 说 的 最 坏 情况 。 作 者 提出 
这 个 问题 是 为 了 提示 读者 ， 在 竞赛 时 使 用 Java 8 的 方法 可 能 会 降低 效率 。 译 者 注 
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26 FRE 





输入 输出 
abcd =(abcd) ! 
aaaa =a‘ 


ababab =(ab)’ 


e 应 用 

假设 你 获得 一 个 周期 信号 的 取样 结果 ， 需 要 找到 该 信号 的 最 短 周期 。 此 问题 可 以 简化 为 
个 最 短 周期 ， 使 得 输入 内 容 总 是 这 一 最 短 周 期 的 多 次 重复 。 
e 定义 

设 一 个 字符 串 x， 找 到 一 个 最 大 整数 上， 使 得 存在 一 个 字符 串 》， 令 x = yh, XE y 的 大 次 震 被 
定义 为 字符 串 y 拼接 上 次 。 问 题 至 少 有 一 个 结果 ， 因 为 x=xl。 

f k BRU BE m 等 于 x， 同 时 对 于 p = m/k, x 中 每 个 字符 都 应 该 与 下 标 较 远 的 字符 p 相等 ， 此 
时 x 被 视 为 圆周 字符 串 。 在 圆周 字符 串 x 中 ， 最 后 一 个 字符 串 之 后 的 字符 被 定义 为 字符 串 * 的 第 一 
个 字符 。 转 动 一 次 字符 串 x 会 把 其 第 一 个 字符 删 掉 ， 并 将 该 字符 添加 到 字符 串 尾 部 。 当 转动 操作 的 
执行 次 数 等 于 字符 串 x 中 的 字符 个 数 时 ， 字 符 串 x 变换 后 仍 是 字符 串 xo 
e 线性 时 间 复 杂 度 的 算法 

问题 变 为 寻找 最 小 的 p (p S 1 )， 使 得 字符 串 x 在 进行 p 次 转动 后 仍 等 于 x。 这 里 要 使 用 圆周 
字符 串 算 法 中 的 一 个 经 典 技巧 :在 字符 串 xx (x 后 接 x) 中 查找 x 第 一 次 出 现 的 位 置 一 一 当然 ， 要 
去 掉 第 0 个 位 置 (图 2.6 )。 
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26 如果 字 符 串 x 在 4 次 转动 后 仍 得 到 x， 那 么 字符 串 x 的 最 小 周期 是 4 





def powerstring(x): 
return len(x) // (x + x).find(x, 1) 











2.7 ”模式 匹配 算法 : Rabin-Karp 算法 


SRE: 一 般 为 O(ntm)， 最 差 情 况 为 O(nm)。 
e 算法 
Rabin-Karp 算法 ( 见 参 考 文献 [17] ) 与 KMP 模式 匹配 算法 基于 完全 不 同 的 思路 。 为 了 在 大 字 





FEB s 中 找到 字符 串 t, MZE s 上 滑动 一 个 长 度 为 len(?) 的 窗口 ， 然 后 判断 这 个 窗口 的 内 容 是 否 与 
t 相等。 逐个 对 比 字 符 串 所 需 的 时 间 成 本 太 高 ， 所 以 需要 计算 当前 窗口 内 容 的 散 列 值 。 比 较 窗口 内 
容 和 字符 串 上 的 散 列 值 ， 速 度 会 更 快 。 当 两 个 字符 串 的 散 列 值 吻合 时 ， 再 进行 耗 时 较 长 的 逐个 比较 
字符 串 操 作 (图 2.7 )。 因 此 ， 为 了 得 到 更 好 的 时 间 复 杂 度 ， 我们 需要 一 个 高 效 的 方法 来 获取 到 当前 
窗口 内 容 的 散 列 值 ， 这 就 要 用 到 滑动 散 列 函 数 ( hash function )。 

如 果 散 列 函数 值 范 围 为 {0, 1,…, p-1}， 而 且 选 择 得 当 ， 那 么 “发 生 磁 撞 ” 的 概率 能 达到 1/p。 
所 谓 碰撞 ， 指 的 是 两 个 长 度 相 等 、 顺 序 一 致 的 独立 字符 串 s 和 上 被 提取 出 同样 的 散 列 值 。 在 这 种 情 
况 下 ， 当 前 算法 的 平均 时 间 复 杂 度 是 O(ntmtm/p)。 算 法 实现 方式 使 用 的 是 p = 23-1， 因 此 在 实际 
情况 下 ， 算 法 时 间 复 杂 度 是 O(n+tm)*， 而 最 坏 情 况 下 的 算法 时 间 复 杂 度 是 O(nm)。 
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图 2.7 Rabin-Karp 算法 的 思路 是 首先 比较 上 和 s 中 窗口 的 散 列 值 ， 
然后 再 逐个 比较 字符 串 


e 计算 滑动 窗口 散 列 值 的 方法 

散 列 函数 首先 把 包含 m 个 字符 的 字符 串 变 换 成 包含 m 个 整数 的 序列 x0…, x,,,， 并 与 字符 的 
ASCII 码 对 应 ， 整 数 介 于 0 至 127 之 间 “。 因 此 ， 散 列 函 数值 有 如 下 多 线性 表示 法 : 

h(xo,*, Xm-1) = Xo © 128+ x, * 128"74,+++, +x,,5 © 128+ x„ mod p 

其 中 所 有 操作 都 被 一 个 大 质数 p 进行 了 取 模 运算 (modulo )。 在 实际 操作 中 要 特别 注意 ， 所 有 计算 
值 都 应 能 被 一 个 64 位 机 调用 ， 其 中 一 个 机 器 字 ( 处 理 右 的 寄存 右 ) 应 当 处 在 -28 到 26-1 之 间 。 最 
大 的 中 间 临 时 变量 是 128 . p-1)=27. (p-1)， 这 也 是 算法 实现 中 选择 p < 25° 的 原因 。 

这 一 散 列 函数 的 多 项 式 形式 可 在 常数 时 间 内 通过 xo、x 和 h(xo…, Xn) 计算 Ac Xn) 值 : 抽 
取 第 一 个 字符 等 价 于 抽取 多 项 式 的 第 一 项 ， 字 符 串 左 移 等 价 于 多 项 式 乘 以 128， 修 改 最 后 一 个 字符 
等 价 于 添加 多 项 式 的 一 项 。 于 是 ， 让 窗口 在 字符 串 s 上 移动 ， 更 新 窗口 内 字符 串 的 散 列 值 并 与 字符 
EE 1 进行 比较 ， 都 可 以 在 常数 时 间 内 完成 。 注 意 ， 把 字符 串 向 右 移动 等 价 于 字符 串 乘 以 128 Xf p 取 
模 的 倒数 ， 其 运算 时 间 也 是 常数 3。 



























































© 因为 pp 值 很 大 ， 使 得 m/p 值 小 到 可 以 忽略 。 一 一 译 者 注 

Q 128 的 乘 方 可 以 用 二 进 制 位 移 运 算 ， 不 会 耗费 太 多 时 间 。 译 者 注 

© 假设 从 左 向 右 移动 窗口 ， 那 么 每 次 移动 窗口 都 要 移 除 字符 囊 1 最 左边 的 字符 ， 并 在 最 右边 添加 字符 。 
用 多 项 式 表示 该 操作 ， 等 同 于 添加 多 项 式 的 项 ， 并 将 全 部 项 乘 以 128。 译 者 注 
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算 结 


在 以 下 代码 中 ， 在 散 列 值 中 加 DOMAIN*PRIME 是 为 了 保证 计算 结果 是 正 值 或 空 值 。 这 在 
Python 语言 中 并 不 是 必要 的 ,但 在 C++ 等 其 他 语言 中 ， 取 模 运 算 可 能 会 得 到 负 的 返回 值 。 





a 














PRIME = 72057594037927931 # < 2°{56} 

DOMAIN = 128 

def roll hash(old_ val, out_digit, in digit, last pos): 
val = (old_val - out_digit * last_pos + DOMAIN * PRIME) % PRIME 
val = (val * DOMAIN) % PRIME 


o 


return (val + in digit) % PRIME 
算法 的 实现 从 逐个 比较 长 度 为 大 的 子 串 开始 ， 即 从 在 字符 串 s 中 位 于 的 字符 和 在 字符 串 1 中 
位 于 j 的 字符 开始 ， 比 较 后 面 的 个 字符 。 























def matches(s, t, i, j, k): 
for d in range(k): 
if sli +d] !=t[j+d]: 
return False 





return True 
接 下 来 实现 真正 意义 上 的 Rabin-Karp 算法 ， 首 先 计算 1 的 散 列 值 和 s 第 一 个 窗口 中 字符 串 的 散 
列 值 ， 然 后 将 s 中 的 所 有 子 字符 串 循环 。 























def rabin karp matching(s, t): 
hash_s = 0 
hash_t = 0 
len_s = len(s) 
len t = len(t) 
last pos = pow(DOMAIN, len t - 1) % PRIME 
if len s < Len ti 
return -1 


for i in range(len t): # 预计 算 
hash_s = (DOMAIN * hash_s + ord(s[i])) % PRIME 
hash_t = (DOMAIN * hash t + ord(t[i])) % PRIME 
for i in range(len_s - len t + 1): 
if hash_s == hash t : # 逐个 比较 字符 
if matches(s, t; i, 0, len t)? 
return i 
if i < len-s = lent: 
hash s= roll hash (hash s, ord(s[i]), ord(s[itlen_t]), last pos) 





return -1 
Rabin-Karp 算法 比 KMP 模式 匹配 算法 的 效率 略 低 ， 根 据 我 们 的 测试 结果 ， 前 者 的 运算 时 间 是 
后 者 的 3 倍 。 但 Rabin-Karp 算法 的 优势 在 于 ， 能 在 多 个 变种 问题 中 应 用 自如 。 
变种 1: 匹配 多 个 模式 
利用 Rabin-Karp 算法 ， 在 给 定 字 符 串 s 中 查找 1 的 问题 可 以 拓展 为 在 字符 串 s 中 查找 一 个 字符 串 
ATA, EP 的 所 有 字符 串 长 度 必须 一 致 。 为 解决 问题 ， 仅 需 把 中 所 有 字符 串 的 散 列 值 
存 人 字典 to_search, 然后 检测 s 每 个 窗口 的 散 列 值 能 和 否 在 字典 to_search 中 找到 相关 值 。 









































变种 2: AFR 
MEFRES 和 一 个 长 度 值 +， 寻 找 一 个 长 度 为 上 的 字 
串 。 为 解决 问题 ， 首 先 考虑 字符 串 1 中 长 度 为 的 所 有 于 串 。 
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FEB Sf, 令 f 同 时 是 s 和 上 的 子 字符 


这 些 子 串 都 可 以 通过 与 Rabin-Karp 算 


法 类 似 的 方式 获得 ， 即 在 + 上 滑动 宽度 为 的 窗口 ， 把 获得 的 散 列 值 存 人 字典 pos。 每 次 获得 一 个 





散 列 值 的 时 候 ， 将 其 与 窗口 位 置 关联 。 
然后 ， 对 于 在 字符 串 s 中 每 个 长 度 为 的 子 串 x， 检 查 其 
果 存 在 ， 再 将 x 与 上 ! 中 位 于 posh] 位 置 的 所 有 子 串 逐 一 比较 。 



































使 用 这 一 算法 时 ， 需 要 选择 恰当 的 散 列 函 数 。 如 果 s 和 + 的 长 度 都 是 ， 
ETF PK 





A O(n) 个 窗口 中 的 一 个 窗口 相互 碰撞 次 数 为 常数 ， 需 要 
献 [17] 来 获得 更 细致 的 解答 。 

变种 3: 最 长 公共 子 串 

给 定 两 个 字符 串 s 和 +， 寻找 其 最 长 公 
最 长 距离 大 的 思路 来 解决 。 算 法 的 时 间 复 杂 
子 串 的 长 度 。 




















中 
J Fa 








这 个 问题 也 可 以 采用 上 述 算法 ， 
O(nlogm), F n © s 和 + 的 总 长 度 ， 而 m 是 优化 


HINE v 是 否 存在 于 字典 pos 中 ， 如 


为 了 让 字符 串 s 和 1 各 
数 pe Q(n)”。 读 者 可 以 参看 参考 文 





并 以 二 分 查找 




















def rabin karp factor(s, t, k): 
last pos = pow(DOMAIN, k - 1) % PRIME 
pos = {} 
assert k > 0 
if len(s) < k or len(t) < k: 
return None 
hash_t = 0 
for j in range(k): # 存 入 散 列 值 列表 
hash_t = (DOMAIN * hash t + ord(t[j])) % PRIME 
for j in range(len(t) - k + 1): 
if hash_t in pos: 
pos [hash_t] .append(j) 
else: 
pos[hash t] = [j] 
if j < len(t) = k; 
hash t = roll_hash(hash_t, ord(t[j]), ord(t[j + k]), last_pos ) 
hash_s = 0 
for i in range(k): # 预计 算 
hash_s = (DOMAIN * hash_s + ord(s[i])) % PRIME 
for i in range(len(s) - k + 1): 
if hash_s in pos: # 此 散 列 值 是 否 存在 于 s? 
for j in pos[hash_s]: 
if matches(s, t, i, j, k): 
return(i, j) 
if i < len(s) = k: 
hash_s = roll _hash(hash_s, ord(s[i]), ord(s[i + k]), last pos) 
return None 











D 碰 接 次 数 过 多 会 


会 影响 散 列 算法 的 性 能 ， 所 以 需要 更 大 范围 的 值 。 





译 者 注 
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28 ”字符 串 的 最 长 回 文 子 串 : Manacher 算法 


输入 : babcbabcbaccba 

输出 : abcbabcba 
© 定义 

如 果 字 符 串 s 的 第 一 个 字符 等 于 最 后 一 个 字符 ， 而 第 二 个 字符 又 等 于 倒数 第 二 个 字符 ， 以 此 类 
推 ， 那 么 该 字符 串 就 是 一 个 回 文 字符 串 。 ”最 长 回 文 子 虽 问题 ”就 是 要 找到 一 个 最 长 子囊， 同时 该 
子 串 是 一 个 回 文子 串 。 


e 复杂 度 

采用 贪 焚 算法 需要 二 次 方 的 时 间 复 杂 度 ; 采用 后 级 表 算法 需要 的 时 间 复 杂 度 是 O(nlogn) ; 采 
Manacher 算法 ( 见 参 考 文献 [23] ) 需要 的 时 间 复 杂 度 是 O(n)。 
e 算法 

首先 在 输入 字符 串 s 的 每 个 字符 前 后 都 添加 # 作为 分 隔 符 ， 在 整个 字符 串 的 首尾 添加 ^ 和 $ 字 
符 ， 比 如 ，abc 会 被 变换 成 ^#a#b#c#$。 变 换 后 的 字符 串 s 用 上 来 记录 。 这 样 做 的 好 处 是 能 够 用 相同 
方法 找到 长 度 为 奇数 和 偶数 的 回 文子 串 。 注 意 ， 在 使 用 这 种 转换 方式 时 ， 所 有 回 文子 串 都 以 分 隔 符 
# 起 始 和 结束 。 因 此 , 每 个 回 文子 串 的 边界 字符 下 标 就 拥有 相同 偶 性 ,这 样 一 来 就 很 容易 能 将 字符 
BB t 的 解决 方法 转换 为 字符 串 s 的 解决 方法 。 分 隔 符 的 存在 方便 了 字符 串 边 界 字 符 的 处 理 。 

单词 nonne 包含 一 个 长 度 为 2 的 回 文 串 nn 和 一 个 长 度 为 3 的 回 文 串 non。 在 转换 后 ， 字 符 串 都 用 分 隔 符 # 来 
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“tn#to#ndnte $$ 























算法 的 输出 是 一 个 数组 p， 它 能 指出 对 于 每 个 位 置 i， 是 否 存 在 某 个 最 长 半径 x， 使 得 从 i-r 到 
itr 位置 的 子 串 是 一 个 回 文子 串 。 贪 禁 算 法 如 下 : 对 于 所 有 i， 初始化 p[i]=0， 然 后 递增 p[i] 直至 找 
到 以 i 为 中 心 的 最 长 回 文子 串 三 -pz 加 Hpi]. 

想 要 优化 Manacher 算法 就 要 初始 化 P[ 四 。 已 知 一 个 以 c 为 中 心 、7 为 半径 的 回 文子 串 ， 也 就 是 
说 ， 子 串 的 结尾 是 d= c+tr。 而 j 是 i 相对 于 c 的 对 称 镜像 (图 2.8 ), plil 和 p[ 四 之 间 有 着 很 强 的 关 
Iko TE itp] PEE d 的 情况 下 ,我们 可 以 用 p 思 来 初始 化 p[i]。 这 一 操作 十 分 有 效 : 假如 以 j 为 中 
>. pli] 为 半径 的 回 文子 串 包 含 在 以 c HPO, d-e 为 半径 的 回 文子 串 的 前 一 半 中 ， 那 么 它 一 定 也 
存在 于 后 一 半 中 。 

在 成 功 初始 化 p[i] 后 ， 需 要 更 新 c 和 ad， 以 保存 用 d-c 最 大 值 编写 的 回 文子 串 的 不 变量 。 算 法 



























































D 对 于 长 度 为 奇数 的 回 文 事 ， 如 aba， 转 换 后 ^#afb#a#$ 的 边界 字符 a 的 下 标 2 和 6 都 是 偶数 ， 对 于 长 度 
为 偶数 的 回 文 事 ， 如 abba， 转 换 后 ^#a#b#b#a#9$ 的 边界 字符 a 下 标 2 和 8 也 都 是 偶数 。 译 者 注 








的 时 间 复 杂 度 呈 线 性 ， 因 为 每 次 比较 字符 都 会 导致 4 的 增加 。 




















| “六 d 


图 2.8 Manacher 算法 。 对 于 下 标 <i， 已 计算 出 数组 yp， 现在 要 计算 pl[i]。 这 是 一 
个 以 c 为 中 心 的 回 文子 串 ， 其 半径 为 4-c， 最 大 值 为 4， 而 且 j 是 i 以 c 为 对 


称 的 镜像 。 对 称 来 看 


， 以 7 为 中 心 、P 四 为 半径 的 回 文子 串 应 当 与 以 7 为 中 


心 的 字符 等 同 ， 至 少 在 半径 d-i 内 是 如 此 。 于 是 , p[ 对 于 pli] 的 值 来 说 就 


是 一 个 下 界 





def manacher(s): 


if s == ""; 
return (0, 1) 


t = "^" + "#".join(s) + "#$ 
c=0 
d=0 
p = [0] * len(t) 
for i in range(1, len(t) - 1) 
mirror =2 * c-i 
pli] = max(0, min(d - i, 


while t[i + 1 + p[i]] == 
pli] += 1 








if i + pli] > d: 

c=i 

d = i + pii] 
(k, i) = max((p[i], i) for i 
return((i - k) // 2, (i + k) 





assert '$' not in s and '^' not in s and '#' not in s 


" 


| 相对 于 中 心 Cc 翻转 下 标 i 

# = c= (i-c) 
pl[mirror])) 
-- ŠA i APDWERFSHKE 
bi = r= ptij]: 









































-- 必要 时 调整 中 心 点 


in range(1, len(t) - 1) 
// 2) # 输出 结果 











e 应 用 


一 个 人 在 城 里 漫步 ， 他 的 智能 手机 记录 下 了 所 有 移动 路 线 。 我 们 获取 这 些 路 线 记 录 ， 并 尝试 在 








其 中 找到 某 段 特定 路 程 ， 即 在 两 点 间 旬 


FE 返 的 相同 路 程 。 为 解决 这 个 问题 ， 可 以 提取 一 个 所 有 路 口 的 








列表 ,并 在 其 中 寻找 回 文子 串 。 
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什么 是 动态 规划 ? 把 问题 解答 方案 的 所 有 子 方 案 保存 下 来 并 将 之 合并 ， 以 此 表示 完整 的 解决 方案 ， 
这 种 方法 就 是 动态 规划 。 我 们 用 扫描 方式 计算 子 方案 ,将 之 保存 起 来 以 便 后 续 使 用 ( 即 “ 记 忆 化 ”原理 
这 种 技术 在 序列 的 相关 问题 中 尤其 奏效 ， 因 为 序列 问题 的 子 问题 有 时 可 以 用 序列 本 身 的 前 级 来 定义 。 





























3.1 网 格 中 的 最 短路 径 


e 定义 

在 一 个 (n+1) x (m+1) 的 网 格 中 ， 每 个 格子 的 编号 都 是 (i,7 站 , 其 中 0 <i<nHO<j 二 m。 格 
子 之 间 用 有 权重 的 路 径 连 接 : 每 个 格子 (i, /) 的 来 路 格子 都 是 (i-1 (i-1, j-1) 和 (i,j-1)， 只 有 第 一 
行 第 一 列 的 格子 没有 来 路 节点 (图 3.1 ) ©. TAS CEFR AIM (0, 0) 到 (n,m) 的 最 短路 径 。 


AO 
加 Sb EO 


0 p 1 


G+) D 


图 3.1 在 一 个 有 向 网 格 中 的 最 短路 径 ， 用 加 粗 实 线条 表示 




















e 
of 





D 来 路 节点 的 定义 为 : 要 抵达 一 个 格子 (i,j)， 只 能 从 其 左 方 、 上 方 和 左上 方 进 入 ; 或 者 说 ， 在 网 格 中 移 
动 的 方向 只 能 是 向 右 、 向 下 或 是 向 右 下 方 。 译 者 注 
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e 时 间 复 杂 度 为 O(nm) 的 算法 

图 3.1 有 方向 却 没 有 环 ， 即 有 向 无 环 图 (Directed Acyclic Graph, DAG )， 我 们 可 以 采用 动态 
规划 的 思路 ， 通 过 特定 顺序 计算 从 (0, 0) 到 每 一 个 格子 (i, D 的 距离 ， 来 解决 这 个 问题 。 首 先 ， 通 
向 第 一 行 和 第 一 列 的 每 个 节点 的 距离 是 最 容易 计算 的 ， 因 为 通 向 每 个 节点 的 路 径 是 唯一 的 。 然 
后 ， 用 词典 序 方式 计算 通 向 所 有 (i, j, BA 1 <i<n 上 且 <j<m 的 格子 的 距离 。 因 此 ， 从 (0, 0) 
到 (i, D 的 距离 一 定 有 三 种 可 能 性 ， 而 这 三 个 数字 都 是 确定 的 ， 因 为 通 向 来 路 节点 的 最 短 距离 都 已 
经 计算 好 了 P 


。 变种 


很 多 经 典 问题 都 可 以 简化 为 这 个 简单 问题 ， 比 如 下 节 要 介绍 的 各 种 问题 。 



























































3.2 编辑 距离 ( 列 文 斯 登 距 离 ) 


输入 : AUDI, LADA 
输出 : LA-DA 
-AUDI 
3 个 操作 : ML, FAU, HARR I? 
e 定义 
给 定 两 个 序列 x 和 y， 需 要 多 少 次 增 、 删 、 改 的 操作 ， 才 能 把 x 变 成 y? 在 unix 命 令 diff 
中 ， 这 段 距离 显示 为 两 个 给 定 文件 中 的 对 应 行 之 间 相 互 变换 所 需 的 最 少 操作 次 数 。 


e 时 间 复 杂 度 为 O(nm) 的 算法 

对 n= |x|, m= |y| 使 用 动态 规划 法 (图 3.2 )， 算 法 时 间 复 杂 度 为 O(nm)。 我 们 要 计算 一 个 数组 
Ali, /], CÆKEXK i WHA x 和 长 度 为 j 的 前 级 y 之 间 的 距离 。 我 们 从 初始 化 开始 ， 定 义 AO, = J 
和 4[i, 0] = i9。 一 般 情 况 下 ， 当 i 和 j 都 三 1， 前 缀 的 最 后 几 个 字母 有 三 种 可 能 情况 : x, 被 删除 ; y 
被 插入 到 尾部 ; x, Ry, FR (如果 它们 不 相同 )。 这 三 种 情况 让 我 们 可 以 用 递归 方式 定义 以 下 三 


个 公式 




















A{i-1, j -1]+ match(x,, y;) 
Afi, j] = min; Afi, j —1]+1 
Afi-1, j]+1 





DQ 由 于 从 左上 角 到 右 下 角 的 前 进 方向 只 有 三 种 可 能 性 ， 即 到 达 一 个 节点 的 来 路 只 有 三 种 可 能 ， 因 而 到 
达 某 个 特定 节点 的 距离 仅 由 其 三 个 可 能 的 来 路 节点 加 上 这 三 个 来 路 节点 到 这 个 节点 的 距离 决定 ， 其 
中 最 短 距 离 就 是 到 达 这 个 节点 的 最 短路 径 。 一 一 译 者 注 

© AUDI 和 LADA 是 两 个 汽车 品牌 奥迪 和 拉 达 。 译 者 注 

© 长 度 为 0 的 前 级 变 成 长 度 为 n 的 前 级 需要 的 操作 一 定 是 n 次 。 








译 者 注 
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其 中 match 是 一 个 返回 布尔 值 的 函数 ， 当 两 个 参数 不 相等 时 ， 函 数 会 返回 1。 这 个 方法 定义 了 和 蔡 换 

一 个 字母 的 成 本 。 成 本 是 可 以 调整 的 ， 比 如 说 ， 成 本 可 能 取决 于 字母 在 键盘 上 的 距离 。 

© 操作 序列 
除了 计算 编辑 距离 ， 还 要 计算 把 x 变换 成 y 所 需 的 操作 次 数 。 我 们 可 以 使 用 在 图 中 查找 最 短路 

径 的 方式 。 通 过 遍历 所 有 来 路 节点 的 距离 ， 我 们 就 能 找到 通 向 项 端的 一 条 最 短路 径 。 这 样 一 来 ,我 

们 就 能 从 节点 (n, m) 一 直上 升 到 (0, 0)， 并 在 上 升 的 沿途 路 径 中 ， 计 算出 最 优 方案 的 所 有 操作 步骤 。 

最 后 ， 只 要 把 这 个 序列 逆序 排列 即 可 得 到 答案 。 






























































L A D A 
YN 2 1 SA -(4) 
A 1 1 1 1 1 ‘0 1 
Y Y Y 
Ry R 1—1 a. 3 
U 1 1 1 1 1 1 





























在 动态 规划 中 ， 图 的 下 标 从 0 开始 ， 而 两 个 待 变换 字符 串 的 下 标 从 1 开始 。 在 实现 的 时 候 要 注 





© ”注意 ， 竖 排 字 符 串 是 AUDI， 横 排 字 符 串 是 LADA。 从 左上 到 右 下 的 操作 是 : MAL, E1; AR 
变 ， 距 离 0; AU, 距离 1; D 不 变 ， 距 离 0; A 替换 成 TI， 距离 1。 最 短路 径 的 5 个 步骤 是 1-0-1- 
0-1。 译 者 注 
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def levenshtein(x, y): 
n = len(x) 
m = len(y) 
# ”初始 化 第 0 行 和 第 0 列 
A= [[i + j for j in range(m + 1)] for i in range(n + 1)] 
for i in range(n): 
for j in range(m): 
Ali + 1][5 + 1] = min (Alilia + 1] +1, # 插入 
Ali + 2) + 1; + 删除 
A[i] [j] + int(x[i] != y[j])) + BR 
return A[n] [m] 
。 深入 思考 
在 实际 应 用 中 ， 人 们 已 经 提出 了 性 能 更 好 的 算法 。 比 如 ， 如 果 已 知 两 个 字符 串 编 辑 距离 的 长 度 




















上 限 s， 我 们 可 以 把 上 述 动态 规划 ， 和 矩阵 A 的 对 角 线 长 度 限 
间 复 杂 度 为 O(s min{n, m}) 的 算法 ( 见 参 考 文献 [28] )。 





证 为 最 大 编辑 距离 *， 从 而 得 到 一 个 时 




















长 公共 


长 公共 子 序列 
输入 : GAC, AGCAT 
输出 :A G C AT 

| | 

G A C 


3.3 


定义 

设 一 个 符号 集合 >。 对 于 两 个 序列 s, xe*， 如 果 存 在 下 标 ii <… 二 i 使 得 对 于 所 有 xx = si， 
P k=l, |s|， 那 么 我 们 定义 是 x 的 子 序列 。 假 设 有 两 个 序列 yesZ* ， 需 要 找到 长 度 最 大 的 
列 ss>*， 而 且 它 同时 是 x 和? 的 子 序列 。 

问题 的 另外 一 个 表述 方式 为 “配对 ”( 见 9.1 节 ) 我 们 在 两 个 序列 x 和 y 中 寻找 配对 的 最 大 可 
使 得 这 两 个 序列 中 的 字母 配对 连 线 不 交叉 〈 图 3.3 )。 
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H; 
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在 一 个 文件 同步 系统 


FP， 为 了 最 小 化 网 络 传输 流量 ,我 们 希望 仅 发 送 被 修改 过 的 部 分 ， 而 





不 是 把 文件 完整 地 发 送 到 月 
序列 。 
这 类 问题 同样 出 现在 生 








R 务 器 。 为 了 满足 这 个 需求 ， 必 须 找 到 旧 文 件 和 新 文件 的 最 大 公共 子 





物 信息 学 中 ， 用 于 对 齐 两 条 DNA 序列 。 
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A BCODAE 
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A E D BE A 

















图 3.3 最 长 子 序 列 问题 可 以 被 视 为 寻找 两 个 给 定 序列 的 最 大 无 交叉 配对 问 
题 。 比 如 ， 图 中 字母 B 的 配对 会 与 字母 D 的 配对 产生 交叉 


e 时 间 复 杂 度 为 O(nm) 的 算法 

“in = |x| Mm = plit, HFA Sisan 和 0<j<m ,我们 计算 前 缀 x... o A yy 的 最 长 
公共 子 序列 。 这 就 得 到 一 个 复杂 度 为 nm 的 子 问题 。 基 于 (i-1, 站、(i, j-1) 和 (i-1,j-1) 在 常数 时 间 
内 得 到 的 解 ， 就 能 得 到 (i, 有) 的 最 优 解 。 因 此 ， 我 们 可 以 在 时 间 O(nm) 内 解决 问题 (n,m)。 算 法 基 
以 下 测试 结果 。 
e 关键 测试 

设 序列 x.…, x; Pye, y 的 最 长 公共 子 序列 为 4[i, jlo 在 i=0 或 j=0 时 ，4[i, 用 为 空 。 当 x 
AY, x; All x; 中 的 一 个 肯定 不 在 最 优 解 中 ， 而 且 Ali, j] Æ A[i-1, j] # Ali, 7-1] 中 最 长 的 序列 了。 当 x = 
时 ， 存 在 一 个 最 优 解 使 得 字符 相关 ， 而 且 4[i, j] 等 于 4[i-1, j-1] xo 这 里 的 符号 “. ”表示 字符 串 拼 
接 。 使 用 maximum 函数 可 以 让 最 长 序列 延伸 >。 















































def longest common subsequence (x, y): 
n = len (x) 


m = len(y) 
# -- 计算 最 优 长 度 
A = [[0 for j in range(m + 1)] for i in range(n + 1)] 


for i in range(n): 
for j in range(m): 





if x[i] == yljl: 
A[i + 1][j + 1] = A[i][j] + 1 
else: 
Ali + 1][j + 1] = max(A[i][j + 1], Ali + 1][j]) 
# -- 输出 结果 
sol = [] 
i, Jj =n, m 
while A[i][j] > 0: 
if A[i] [j] == Afi - 1] [3]: 
i -= 1 

















@ 因为 是 两 个 序列 比较 ， 所 以 是 比 长 短 而 不 是 大 小 。 译 者 注 

D 当 x= 少时， 如 果 两 个 序列 最 后 一 个 元 素 不 一 样 ， 那 么 这 两 个 元 素 中 肯定 有 一 个 不 在 最 终结 果 中 ， 
而 且 最 优 解 一 定 等 于 各 少 一 个 元 素 的 子 序 列 中 较 长 的 那 一 个 : 4[i-1, 让 是 从 4[i, j] Atx Ali j-1] 是 
从 A[, 月 去 掉 y。 这 里 的 思路 也 是 把 大 问题 拆 分 成 小 问题 ， 想 找到 Ali, 月， 可 以 先 尝试 找 4[i-1, 有] 和 
A[i,j-1]， 一 步 步 缩 短 目 标 序 列 ， 从 而 简化 问题 。 译 者 注 
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elif A[i][j] == Alil{j - 1]: 
J == 1 
else: 
i -= 1 
j -= 1 
sol.append(x[i]) 
return ''.join(sol[::-1]) + 列表 反 转 








。 变种 : 给 定 多 个 序列 

假设 我 们 不 是 从 两 个 序列 而 是 从 个 序列 中 寻找 最 长 公共 子 序列 ， 序 列 长 度 分 别 为 1,.…, A 
那么 可 以 使 用 以 下 方法 。 我 们 需要 计算 一 个 k 维 矩阵 A， 计 算 所 有 给 定 序列 的 前 缀 组 合 产生 的 最 长 
公共 子 序列 。 这 个 算法 的 时 间 复 杂 度 是 O(2*] ,7,) 。 
































o 变种 : 给 定 两 个 排 好 序 的 序列 
当 两 个 序列 都 已 经 排 好 序 时 ， 问 题 可 以 在 时 间 Onm) 内 解决 。 因 为 在 这 种 情况 下 ， 我 们 可 以 
使 用 合并 两 个 已 排序 队列 的 方法 ( 见 4.1 节 )。 


° 实践 
使 用 BLAST 算法 (Basic Local Alignment Search Tool )， 但 它 不 能 保证 总 是 得 出 最 优 解 。 




















3.4 ”升序 最 长 子 序列 


。 定 久 
给 定 一 个 包含 个 整数 的 序列 x， 需 要 找到 它 的 一 个 子 序 列 s， 使 得 s 长 度 最 长 且 是 严格 的 
升序 。 


e 应 用 

想象 有 一 条 通 向 大 海 的 直路 ， 路 边 有 很 多 房子 ， 每 一 栋 房 子 都 有 多 层 。 当 任何 一 栋 房 子 和 大 海 
之 间 的 所 有 房子 的 层 数 都 能 少 一 点 的 时 候 ， 从 这 栋 房 子 就 可 以 看 到 大 海 。 我 们 希望 所 有 房子 都 能 够 
看 到 大 海 ， 同 时 只 拆除 尽 可 能 少 的 房子 来 达到 这 个 目标 (图 3.4 ) 


7 us 


图 3.4 拆除 尽 可 能 少 的 房子 ， 使 得 被 保留 下 来 的 所 有 房子 都 能 看 到 大 海 
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e SEA O(nlogn) 的 算法 

准确 地 说 ， 算 法 的 复杂 度 是 O(nlogm)， 其 中 m 是 最 终 计 算得 到 的 长 度 。 当 使 用 穷 举 算法 
时 ， 对 于 每 一 个 i， 我 们 希望 为 x; 元 素 拼接 一 个 前 级 为 x;,…, xi 的 升序 最 长 子 序列 。 但 是 ， 这 
些 子 序列 中 哪个 能 得 到 最 优 解 呢 ? 让 我 们 先 考 虑 一 下 前 级 的 所 有 升序 子 序列 。 在 一 个 升序 子 序 
列 y 中 ， 两 个 属性 是 最 重要 的 : 长 度 ， 及 其 最 后 一 个 元 素 。 从 直觉 上 判断 ， 在 这 些 升序 子 序列 
中 ， 我 们 更 喜欢 长 度 较 长 的 ， 因 为 长 度 才 是 需要 优化 的 属性 ; 同时 ， 用 一 个 小 元 素 结尾 更 容易 
达成 目标 。 

为 了 证 实 这 个 直觉 判断 ， 我 们 把 子 序列 y 的 长 度 记 为 yj， 把 y 的 最 后 一 个 元 素 记 为 y 1,。 当 
by 三 |z| 且 yi 三 zj,， 且 两 个 不 等 式 中 有 一 个 是 严格 不 等 时 ， 我 们 称 y 支配 z。 这 时 ， 只 需要 关注 非 
支配 子 序列 ， 将 它 补 全 为 一 个 最 优 子 序列 ( 图 3.5 )。 
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图 3.5 计算 升序 最 长 子 序 列 。 图 中 灰色 部 分 是 序列 x 正在 被 处 理 的 部 分 。 对 于 被 
考虑 的 前 弘 ， 被 维护 的 的 序列 是 (),(1),(1, 2),(1, 2, 4),(1, 2, 4, 5)。 处 理 输入 
字符 3 之后， 序列 (1, 2, 4) 会 被 序列 (1, 2, 3) 取代 





AE xe, xi 的 各 个 非 支 配子 序列 的 长 度 不同 。 对 于 长 度 上 我 们 保存 一 个 长 度 为 上 上 且 以 一 个 
最 小 整数 结尾 的 子 序列 。 具 体 来 说 ， 我 们 维护 一 个 数组 5，2b[ 有 ] 是 长 度 为 大 的 最 长 子 序 列 的 最 后 一 
个 元 素 ， 且 设 定 b[0] = -ce。 

数组 b 是 严格 递增 的 。 这 样 一 来 ， 在 处 理 x; 元素 时 ， 最 多 只 有 一 个 子 序 列 需要 更 新 。 尤 其 ， 当 
满足 b[k-1] <x, < b[ 科 时 ,我们 可 以 用 x 补 全 长 度 为 -1 的 序列 尾部 ， 以 此 得 到 一 个 更 好 的 、 长 
度 为 的 子 序列 ， 也 就 是 说 ， 该 子 序列 的 结尾 是 一 个 最 小 元 素 。 当 x 比 5 中 的 所 有 元 素 都 大 时 ， 我 
们 使 用 x 元 素来 增加 bp。 这 是 唯一 可 能 的 优化 手段 ， 并 且 使 用 二 分 法 可 以 在 在 时 间 O(log|b|) 内 实现 
ARFER k, HEF |b 是 5b 的 长 度 ”。 




































































O 替换 和 补 全 方式 就 是 前 面 所 说 的 “关注 非 支配 子 序列 "， 并 将 非 支配 子 序列 优化 为 最 优 子 序列 的 具体 
过 程 。 当 满足 Bb[k-1] <x, <b] ht, pl- E yaiz BA KF bik- PA, KRI x, 
时 ， 我 们 只 需 更 新 b[k-1] A DK] 中 的 一 个 就 有 机 会 得 到 一 个 更 好 的 答案 ， 即 长 度 更 长 的 b[k-1] RR 
尾 元 素 更 小 的 bik] 译 者 注 
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e 实现 细节 
数组 h 和 编 成 的 列表 将 子 序列 编码 了"。 列 表 头 使 用 有 来 表示 ,有 5[ 和 和 = xfA[A]]. IER j 之 前 的 
元 素 用 z 四 来 表示 。 列 表 使 用 常数 None 来 结尾 (Al 3.5 )。 


from bisect import bisect_left 





def longest increasing subsequence (x) : 
n = len(x) 


p= [None] * n 
h = [None] 
b = [float('-inf')] # ALS 


for i in range(n): 

if x[i] > bil) 
pli] = h[-1] 

) 


h.append (i 
b.append(x[i]) 
else: 

# - 二 分 查找 : b[k - 1] < x[i] <= b[k] 
k = bisect_left(b, x[i]) 
h[k] = i 
b[k] = x[i] 
pli] = kik - 1] 

# 显示 结果 

q = h[-1] 


while q is not None: 
s.append (x[q]) 
q = piq] 

return s[::-1] 











e 变种 : 非 降 序 子 序列 

如 果子 序列 不 一 定 要 严格 升序 ， 而 只 需 不 是 降序 即 可 ， 那 么 我 们 不 再 查找 使 得 b [k-1] < 
x[i] < b[ 有 成 立 的 k， 而 是 查找 使 得 5b[k-1] < x; < 5b[ 如 成 立 的 x。 这 种 算法 可 以 用 Python 语言 的 
bisect right 方法 来 实现 。 


e 变种 : 公共 最 长 升序 子 序列 

sa dn y， 我 们 希望 找到 它们 的 公共 最 长 升序 子 序列 。 这 个 问题 可 以 在 立方 时 间 内 
解决 : 首先 从 y 的 排序 开始 ， 借 此 得 到 一 个 序列 z， 然 后 寻找 x、y 和 z 的 一 个 公共 序列 。2005 年 ， 
有 人 发 表 了 一 个 更 好 的 、 时 间 复 杂 度 为 Olx pb) 的 算法 ( 见 参考 文献 [29] )， 但 这 个 算法 复杂 度 早 
在 2003 年 的 ACM/ICPC/NEERC 编程 竞赛 中 就 已 经 出 现 。 























DQ AEF OL] 中 长 度 不 同 的 子 序列 。 译 者 注 
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3.5 ”两 位 玩家 游戏 中 的 必 胜 策略 


e 定义 

假设 两 个 玩家 用 一 堆 正 整数 进行 游戏 ( 图 3.6 )。 玩 家 0 先 开始 。 如 果 栈 已 经 为 空 ， 那 么 他 就 输 
了 游戏 ; 和 否则， 如果 栈 的 顶端 包含 一 个 整数 x， 他 就 可 以 选择 去 掉 栈 顶 的 一 个 元 素 或 个 元 素 一 一 
后 一 个 选项 仅 在 栈 中 至 少 还 有 x 个 元 素 时 被 允许 。 然 后 ， 由 玩家 1 来 继续 游戏 。 接 下 来 ， 双 方 按照 
同样 的 规则 继续 游戏 。 现 在 有 一 个 包含 n 个 整数 的 栈 P， 问 题 是 : 玩家 0 是 否 有 一 个 必 胜 策略 ?也 
就 是 说 ， 他 是 否 能 在 玩家 1 做 出 任何 选择 的 情况 下 都 能 确保 获胜 ? 



























































图 3.6 一 局 游戏 
算法 复杂 度 : 线性 。 


e 动态 规划 的 算法 

模拟 游戏 进程 的 成 本 非常 高 :“ 二 选 一 ”会 让 方案 组 合成 爆炸 式 增长 。 这 里 正 是 动态 规划 的 用 武 
之 地 。 设 一 个 大 小 为 n 的 布尔 型 数组 G，G[i] 表示 在 数字 栈 缩小 为 前 i 个 元 素 的 情况 下 ， 一 个 玩家 
能 否 在 先 手 时 获胜 。 最 终 目 的 是 : 玩家 0 找到 一 个 必 胜 策略 ,使 得 玩家 1 处 于 无 法 获胜 的 劣势 。 

有 一 个 基础 情况 是 G[0] = False, 而 对 于 > 0 的 情况 ， 则 有 : 




















Gti] Gfi-l]v Gļi- P[i]] 如 果 P[i] 宇 0 

A E 
Gli -1] 否则 

使 用 一 个 简单 线性 数字 步 数 的 遍历 ， 就 能 填充 数组 G， 并 通过 寻找 G[n-1] 的 答案 来 解决 问题 。 




















数组 是 最 重要 的 基础 数据 类 型 之 一 。 在 很 多 简单 问题 中 ， 除 了 数组 之 外 不 需要 其 他 任何 数据 结 


构 。 我 们 可 以 在 常数 时 间 内 修改 一 个 指定 下 标的 元 素 。 相 反 ， 列 表 不 能 可 
性 时 间 内 新 建 一 个 数组 。 数 组 中 的 元 素 从 0 开始 索引 。 一 定 要 注意 ,在读 和 写 的 时 候 ， 万 一 元 素 编 

















号 从 1 开始 ,在读 取 和 显示 其 中 数据 时 ， 仍 然 要 从 0 开始。 











A> 
数组 也 能 被 简单 用 于 编码 一 棵 二 又 树 。 一 个 下 标 为 i 的 节点 的 父 节 点 下 标 是 [1/2], 























FRÆ 2i, 








右 子 节点 下 标 是 2i+1， 根 节点 下 标 是 1。 下 标 是 0 的 元 素 被 忽略 掉 了 。 





入 或 删除 元 素 ， 除 非 在 线 


HALT 





本 章 将 探讨 数组 的 经 典 问题 ， 以 及 用 来 处 理 被 称 为 “区 间 ” 的 下 标 区 间 问 题 的 数据 结构 ， 比 如 


计算 一 个 区 间 中 最 小 值 。 最 后 两 小 节 描 述 了 动态 的 数据 结构 ， 提 出 了 修改 和 查询 数组 的 方法 。 





注意 : 在 Python 语言 中 ， 可 以 用 下 标 -1 访问 数组 t 的 最 后 一 个 元 素 。 数 组 的 逆序 副本 可 以 通 
过 t[::-1] 来 获得 。 在 末尾 新 增 一 个 元 素 的 方法 是 append, Alk, Python 语言 的 数组 类 似 Java 语 
BH ArrayList 类 或 者 C++ 语言 的 vector 类 。 


4.1 合并 已 排序 列表 


e 定义 


给 定 两 个 已 排序 的 列表 x 和 y， 我 们 希望 生成 一 个 有 序 的 列表 z， 包含 x 和 ?了 的 所 有 元 素 。 


e 应 用 














这 个 操作 在 归并 排序 算法 中 很 有 用 。 对 一 个 数组 进行 排序 时 ， 我 们 把 它 拆 分 为 两 个 长 度 一 样 的 


部 分 ( 当 数 组 有 奇数 个 元 素 时 ， 两 部 分 相差 一 个 元 素 ) ; 同时 ， 








后 ， 再 用 下 
































述 过 程 把 两 部 分 合并 起 来 。 算 法 的 时 间 复 杂 度 是 O(nlogn) 次 比较 。 











D 如果 问 题 描述 的 时 候 元 素 编号 从 1 开始 ， 程 序 编写 的 时 候 仍 要 从 0 开始 为 元 素 编号 。 





j 递 归 方式 对 两 部 分 进行 排序 ; 然 


译 者 注 
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e 时 间 复 杂 度 为 线性 的 算法 
用 连 比 法 遍历 两 个 列表 ， 并 逐步 建立 起 z。 关 键 是 每 次 都 要 从 元 素 最 小 的 列表 中 取 值 ， 这 样 就 
能 保证 结果 一 定 是 有 序 的 。 

















def merge(x, y): 
z= [] 
i=0 
] = 0 
while i < len(x) or j < len(y): 
if j == len(y) or i < len(x) and x[i] < y[j]: 
zZ.append(x[i]) 
i += 1 
else: 
z.append (y[j]) 
j += 1 
return z 











e 变种 : 大 个 列表 的 合并 
为 了 快速 找到 需要 取 值 的 列表 ， 我 们 可 以 把 当前 每 个 列表 的 个 元 素 存储 在 一 个 优先 级 队列 
中 。 算 法 的 时 间 复 杂 度 是 O(nlogk), EP n 是 生成 列表 的 长 度 。 

















4.2 区 间 的 总 和 


° 定义 
每 次 查询 都 用 下 标 区 间 记 旋 来 表示 ， 而 且 需 要 返回 在 下 标 ; ( 包括 ) 和 下 标 j ( 不 包括 ) 之 间 
的 区 间 中 所 有 元 素 值 1 的 总 和 。 
。 每 次 查询 时 间 复杂 度 为 0(1) 的 数据 结构 和 时 间 复杂 度 为 O(n) 的 初始 化 方法 

只 需 计算 一 个 包含 了 所 有 1 的 前 级 且 大 小 为 +1 的 数组 。 实 际 上 ，s[ 用 = lil BEE 



































sl0]=0，s[1]=t[0] 时 ，s[n]= 》 di] 。 那 么 查询 [i,j) 的 结果 是 sj]-s[i]。 


43 ”区 间 内 的 重复 内 容 


° 定义 
每 个 查询 都 用 下 标 区 间 来 表示 ， 如 [i,j7) ， 我 们 需要 找到 一 个 在 区 间 内 数组 + 中 至 少 出 现 两 次 的 
元 素 x， 或 声明 所 有 元 素 各 不 相同 。 
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e 每 次 查询 时 间 复杂 度 为 0(1) 的 数据 结构 和 时 间 复 杂 度 为 O(n) 的 初始 化 方法 
通过 一 次 从 左 到 右 的 遍历 ， 我 们 建立 起 一 个 数组 p， 其 中 对 于 每 个 j， 当 1[i]=1[j] 时 ,满足 区 间 
最 大 下 标 i <j. 当 ; 四 第 一 次 出 现时 ， 设 pz[ 站 = -1。 
为 了 计算 p， 在 遍历 中 ,最 后 一 次 在 t 中 出 现 的 x 的 下 标 都 要 储存 。 如 果 能 够 保证 上 中 元 素 的 区 
间 ， 我 们 可 以 用 一 个 数组 来 存储 ; 否则 ， 需 要 用 一 个 基于 散 列 表 的 字典 来 存储 。 
同时 ， 对 于 所 有 i 三 j 的 情况 ， 我们 需要 在 一 个 数组 g 中 保存 每 个 j EOE plio FA, A Ti 
应 查询 [i, 站 ,一 旦 有 qj-1] <i, BAED 中 所 有 元 素 都 会 各 不 相同 ; S, Hap- 是 一 个 重复 值 。 
为 了 确定 出 现 两 次 的 下 标 ， 只 需 同时 使 用 gyl 计算 下 标 i， 得 到 下 标 i 的 最 大 值 。 

































































44 ”区 间 的 最 大 总 和 


© 定义 
这 一 静态 问题 基于 一 个 值 为 1 的 数组 ， 对 于 所 有 满足 i 夺 j 的 下 标 对 记 刀 ， 需 要 计算 tilt 
Hitl}+, +, HU] 的 最 大 值 。 


e SHEA O(n) 的 算法 

这 一 动态 规划 的 算法 是 Jay Kadane 在 1984 年 发 现 的 。 对 于 每 个 下 标 j， 我们 在 所 有 满足 
0 三 i 夺 j 的 下 标 中 查找 is, …, +e] 的 最 大 值 。 用 4 四 来 记录 这 个 值 。 这 个 值 要 么 是 1[， 要 么 由 
tU] FREN tilt, e, +t[j-1] 的 总 和 组 成 ， 该 总 和 应 该 最 大 。 于 是 有 AO] = 40], AAS 1, X 
是 唯一 的 可 能 性 。 综 上 所 述 ， 我 们 得 到 一 个 循环 算式 : ALi] = tf] + max {4[j-1], 0}. 


。 变种 

问题 可 以 推广 到 矩阵 。 给 定 一 个 维度 为 nx m 的 矩阵 M、 一 个 行 下 标的 区 间 [a, b] 和 一 个 列 下 
标的 区 间 [i, 衣 ， 就 此 定义 一 个 矩阵 中 的 矩形 [a, b] O D, 如。 我们 要 找 的 是 总 和 值 最 大 的 矩形 。 为 
此 ， 只 需 在 所 有 行 下 标的 区 间 [a, b] 中 循环 ， 得 到 一 个 长 度 为 加 的 数组 t， 如 [i] = Mla, i]t, 
+M[b, ]。 利 用 与 行 [4, p-1] 相关 的 数组 ， 只 需 增加 矩阵 M 的 第 5 行 ， 即 可 在 时 间 O(m) 内 得 到 数 
组 1。 在 上 述 算 法 的 帮助 下 ， 我 们 可 以 在 时 间 O(m) 内 找到 一 个 组 成 矩形 总 和 值 最 大 的 列 区 间 [i, j], 
矩形 是 由 [a, 5] 各 来 描述 的 。 这 样 就 能 得 到 一 个 时 间 复 杂 度 为 O(n2m) 的 解决 方案 。 






















































































45 查询 区 闻 中 的 最 小 值 : 线段 树 


e 定义 
我 们 希望 维护 一 个 数据 结构 ， 该 数据 结构 中 存储 了 一 个 包含 n 个 元 素 的 数组 :， 并 能 执行 以 下 
操作 : 
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一 变更 给 定 ; 值 的 i] 元 素 的 值 ; 
一 对 于 给 定 的 集合 下 标 i 和， 计算 <d] 最 小 值 。 
。 变种 


不 需要 大 大 变化 ， 我 们 可 以 确定 最 小 元 素 的 下 标 ， 而 非 获 取 它 的 值 。 


e 每 次 查询 时 间 复 杂 度 为 O(logn) 的 数据 结构 

思路 是 用 一 棵 二 叉 树 ( 又 称 线段 树 ) 把 数组 ! 补 全 。 每 个 节点 代表 数组 上 中 的 一 个 下 标 区 间 
(图 4.1 )。 区 间 的 大 小 是 2 的 需 ， 一 个 节点 的 两 个 子 节点 代表 区 间 左 右 两 个 半 区 。 树 的 最 底层 保存 
了 数组 上 中 的 元 素 值 。 在 每 个 节点 中 ， 仅 保存 与 节点 相关 区 间 内 的 数组 最 小 值 。 

更 新 一 次 数组 需要 对 树 结构 进行 指数 次 更 新 ， 并 作用 于 通 向 相关 节点 路 径 上 的 每 个 节点 。 在 一 
个 给 定 区 间 [i,k) 中 查找 最 小 值 , 是 通过 递归 遍历 来 实现 的 。 函 数 _range min(j,start,span,i,k) 
返回 数组 1 在 区 间 [start, starttspan] N [i, A] 中 的 最 小 值 ， 其 中 j 是 与 该 区 间 相 关 的 节点 的 下 标 。 终 
止 查找 有 两 种 可 能 的 条 件 : 要 么 是 当前 节点 的 区 间 包 含 在 [i,k) 范围 内 ， 这 时 需要 返回 节点 的 值 ; 要 
么 是 当前 节点 的 区 间 与 [i,k) 不 相交 ， 这 时 需要 返回 +00, 
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41 用 于 在 一 个 区 间 中 确定 最 小 值 的 树 形 数据 结构 


e 对 复杂 度 的 分 析 

为 了 证 明 查 询 时 间 为 O(logn)， 我 们 要 区 分 遍历 过 程 中 经 过 的 4 种 节点 。 假 设 [s,t) 是 节点 相关 
的 区 间 : 

一 当 [s,t) 和 [i,h) 不 相交 时 ， 节 点 被 称 为 空 节点 ; 

一 当 [s,) Cc[i,k) 时 ， 节 点 被 称 为 满 节点 ; 

一 400k), PARRA TA ; 

一 否则 ， 节 点 被 称 重 又 节点 。 
注意 ， 对 于 一 个 重 芭 节点 来 说 ，[s,t) 和 [i,k) 的 区 间 互 相 重合 ,但 并 不 互相 包含 。 分 析 方 法 就 
是 确定 每 个 类 型 的 节点 数量 。 

查找 方法 range_min 遍历 一 个 对 数 数量 级 的 满 节 点 ， 它 们 对 应 着 [i,k) 区 间 内 不 相交 的 区 间 分 

。 对 于 空 节点 也 一 样 ， 空 节点 对 应 着 [i,k) 区 间 的 补 集 分 量 。 当 检测 到 一 个 重 辣 节点 的 子 节点 总 
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class RangeMinQuery : 
def init (self, t; INF=float('inf')): 
self.INF = INF 





self.N = 1 

while self.N < len(t): # 找到 数组 大 小 NN 
self.N *= 2 

self.s = [self.INF] * (2 * self.N) 

for i in range(len(t)): # 把 七 存 入 叶子 节点 
self.s[self.N + i] = t[i] 

for p in range(self.N - 1, 0, -1): # 填充 所 有 节点 
self.s[p] = min(self.s[2 * p], self.s[2 * p + 1] 


def getitem (self, i): 
return self.s[self.N + i] 


def _setitem__ (self, i, v): 
p = self.N + i 




















self.s[p] = v 
p //= 2 # 在 树 上 上 移 一 层 
while p > 0: # 更 新 节点 
self.s[p] = min(self.s[2 * p], self.s[2 * p + 1] 
p //= 2 
def range min(self, i, k): 
return self. range min(1, 0, self.N, i, k) 
def range min(self, p, start, span, i, k): 
if start + span <= i or k <= start: # 不 相交 区 间 
return self.INF 
if i <= start and start + span <= k: # 包含 区 间 
return self.s[p] 
left = self. range min (2*p, start, span//2, i, k) 


right = self. range min(2*p + 1, start + span // 2, span//2, i, k) 
return min(left, right) 











46 ”计算 区 间 的 总 和 : 树 状 数组 ( Fenwick 树 ) 


° 定义 
我 们 希望 维护 一 个 数据 结构 ， 它 保存 着 包含 个 值 的 数组 :， 并 可 以 进行 下 列 操 作 : 
一 对 于 给 定 下 标 i， 更 新 efi] 的 值 ; 
一 对 于 给 定 下 标 i,， 计算 tJ +t[i]。 
出 于 技术 原因 ，t 的 下 标 范 围 是 从 1 到 n-1， 并 不 包含 0。 


e 变种 
仅 需 一 个 小 改动 ， 这 个 数据 结构 同样 可 以 被 用 于 在 时 间 O(logn) 内 执行 下 列 运算 : 
一 对 于 给 定 的 下 标 a 和 4b， 为 集合 中 每 个 区 间 tal, t[a+1],…, 1[5] 增加 一 个 值 ; 
一 对 于 给 定 下 标 i， 获 取 ei] 的 值 。 
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如 前 一 节 介 绍 过 的 方法 ， 此 问题 可 以 使 用 一 个 线段 树 来 解决 。 只 需 把 其 中 的 co 替换 为 0， 并 把 
min 操作 替换 成 加 法 操作 ， 就 可 以 得 到 一 个 每 次 查询 时 间 复 杂 度 为 O(logn) 的 数据 结构 来 解决 问题 。 
本 节 介 绍 的 数据 结构 性 能 与 之 前 的 类 似 ， 但 可 以 更 快 实现 。 

e 每 次 查询 时 间 复 杂 度 为 O(logn) 的 数据 结构 ( 见 参考 文献 [6] ) 

这 个 数据 结构 不 再 像 前 一 节 所 述 的 那样 原封 不 动 地 存储 数组 +， 而 是 存储 上 的 区 间 总 和 。 因 此 ， 
我 们 需要 新 建 一 个 数组 s， 比 如 ,使 得 满足 je7(i) ASR, A s[i] FE ef] 的 总 和 ， 其 中 (a) 是 按 下 述 
方式 定义 的 一 个 区 间 。 各 区 间 通 过 以 下 方式 组 织 成 一 个 树 形 结构 ， 它 们 之 间 有 两 种 关系 : 父 节 点 和 
左 相 邻 节点 (图 4.2 )。 

一 当 ae{0, 1}* 且 i 是 al0* 的 二 进 制 形 式 时 ,输入 值 s[i] 包含 数 组 1 在 区 间 (i) = {a0'1,---, 73 

内 的 总 和 。 

一 下 标 i=al0* 的 父 节 点 是 计 10。 

一 下 标 i= al0* 的 左 相 邻 节 点 是 j=a00*。 区 间 10) 是 ID 的 左 侧 区 间 。 

因此 ， 当 i=al0* 时， 前 级 1+ tei] 的 总 和 等 于 s[i 加 上 前 级 [1]+…+t[a00 和 。 这 里 需要 使 用 
递归 计算 。 

在 图 4.2 的 例子 里 ， 对 7[11] 更 新 就 必须 改变 s[11=01011,], s[11=01011,]. s[11=01011,], s[12=01100,], 
s[16=10000,]， 而 前 级 7[1],…, t[11] 的 总 和 是 s[11=01011,]、s[10=01010,]、s[8=01000,]。 

实现 上 述 结构 的 一 个 重要 步 又 是 读 取 ; 的 最 低 有 效 位 ， 也 就 是 说 ， 把 二 进 制 格式 的 数字 a10* 转 
换 成 10:。 这 一 操作 可 以 使 用 i&-i 实现 。 以 下 为 解释 : 
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i = al0* 
i =a0l' 
—i=i +1=g10* 
i&-i=10* 
16 
8 i ”二进制 ” 父 节 点 左 相 邻 节点 
1 001 2 g 
4 12 2 010 4 g 
s 3 0ll 4 2 
2 6 10 14 4 100 8 w 
5 101 6 4 
6 110 8 4 
1 3 5 7 9 11| |13} 115 7 ll 8 6 
t }ol1)2/314]516]71/ 8/9 |10/11)12]13]14/15]16 



























































4.2 一 个 树 状 数组 的 例子 。“XX 是 OO 的 父 节点 "”， 这 一 关系 以 从 上 垂直 向 下 投 
影 的 方式 体现 ， 比 如 8 是 4、6 和 7 的 父 节点 。 如 果 区 间 1(i) 在 10) HAM 
邻接 ， 如 4 是 5 和 6 的 左 相 邻 ,那么 下 标 i 是 j 的 左 相 邻 节点 。 





class Fenwick : 
def init__(self, t): 
self.s = [0] * len(t) 
for i in range(1, len(t)): 
self.add(i, t[i]) 


def prefixSum(self, i): 
sum = 0 
while i > 0: 
sum += self.s[i] 
i -= (i & -i) 
return sum 


def intervalSum(self, a, b): 
return self.prefixSum(b) - self.prefixSum(a-1) 


def add(self, i, val): 
assert i> 0 
while i < len(self.s): 
self.s[i] += val 
i += (i & -i) 





# 变种 : 


def intervalAdd(self, a, b, val): 
self.add(a, +val) 
self.add(b + 1, -val) 


def get(self, i): 
return self.prefixSum(i) 











47 ”有 大 个 独立 元 素 的 窗口 


e 定义 


给 定 一 个 包含 n 个 元 素 的 序列 x 和 一 个 整数 万 我 们 和 希望 确定 i 的 所 有 最 大 区 间 ， 使 得 x, 





xa 都 严格 地 由 大 个 不 同 元 素 组 成 (图 4.3 )。 


图 4.3 一 个 严格 包含 了 两 个 不 同 元 素 的 窗口 
e 应 用 











缓存 就 是 被 放 在 慢 速 读 写 内 存 之 前 的 快速 内 存 。 慢 速 内 存 的 寻 址 空间 被 分 





Æ| 


AY 


I 成 相同 的 大 小 ， 称 
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作 分 页 。 绥 存 空间 是 有 限 的 ， 仅 能 保存 大 个 分 页 。 计 算 机 随时 间 推 移 访问 内 存 ， 由 此 形成 一 个 序列 
x， 其 中 每 个 元 素 是 一 个 被 请 求 访问 的 分 页 。 当 一 个 被 请 求 访问 的 分 页 在 缓存 中 时 ， 读 写 速度 加 快 ， 
否则 称 为 缓存 未 命中 。 然 后 ， 应 当 查 找 慢 速 内 存 的 一 个 分 页 ， 令 其 替代 缓存 中 的 另 一 个 分 页 ， 并 将 
后 者 移出 缓存 。 在 序列 x 中 查找 严格 包含 上 个 不 同 元 素 的 区 间 ， 这 一 问题 变 为 在 假设 缓存 初始 配置 
最 优 的 情况 下 ， 找 到 那些 不 存在 缓存 未 命中 的 时 间 区 间 。 


e 时 间 复 杂 度 为 O(n) 的 算法 

思路 是 使 用 两 个 游标 和 /7 来 遍历 序列 x， 其 中 和 7 确定 了 窗口 。 我 们 借助 出 现 频 率 计数 器 
occ， 在 一 个 变量 dist 中 维护 集合 x,…, x. 中 不 同 元 素 的 数量 。 当 ai st E TS% kE, RINE 
i 前进 ,否则 让 7 前 进 "。 以 下 实现 返回 了 一 个 迭代 器 。 该 实现 也 可 以 用 于 另 一 个 函数 , 单独 处 理 
每 个 区 间 。 由 于 两 个 游标 i 和.j 只 能 前 进 ， 因 而 最 多 只 能 执行 2n 次 操作 ， 从 而 获得 一 个 线性 的 复 


杂 度 。 
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def windows_k_distinct (x, k): 
dist, i, J = 0y 0, 0 # dist = |{x[il,..,x[j =1]}| 
occ = {xi: 0 for xi in x} # xli:j] 表示 的 出 现 次 数 
while j < len(x): 
while dist == k: # 移动 头 部 的 区 间 
occ[x[i]] -= 1 # 更 新 计数 器 
if occ[x[i]] == 0: 
dist -= 1 
i += 1 
while j < len(x) and(dist < k or occ[x[j]]): 
if occ[x[j]] == 0: 更 新 计数 器 
dist += 1 
occ[x[j]] += 1 
j += 1 # 移动 末尾 的 区 间 
if dist == 
yield(i, j) # 发 现 一 个 区 间 

















DQ 对 于 下 标 和 遍历 所 使 用 的 游标 来 说 ， 前 进 就 是 下 标 +1， 或 是 迭代 器 获取 下 一 个 元 素 。 译 者 注 


第 5 章 区 间 


与 区 间 相 关 的 很 多 问题 都 可 以 使 用 动态 规划 来 解决 。 位 于 一 个 给 定 阐 值 之 前 和 之 后 的 区 间 可 以 
形成 两 个 独立 的 子 实例 。 

如 果 问 题 多 许 ， 使 用 格式 为 [s, 的 半 开 半 闭 区 间 会 更 简便 ， 因 为 其 中 的 元 素数 量 更 容易 计算 
(lia t-s, FER s 和 + 都 是 整数 )。 




















5.1 KEH ( 线段 树 ) 


e 定义 

把 n 个 给 定 区 间 存 储 在 一 个 数据 结构 中 ， 使 得 拥有 下 述 格 式 的 查询 能 快速 返回 结果 : 对 于 一 个 
给 定 值 p， 哪 个 是 所 有 包含 p 的 区 间 列 表 ? 我 们 先 假设 所 有 区 间 都 是 半 开 半 闭 的 形式 [1, h)， 但 这 个 
数据 结构 也 适应 其 他 区 间 形 式 。 


e 每 次 查询 时 间 复 杂 度 为 O(logntm) 的 数据 结构 

m 是 返回 的 区 间 数 量 。 这 是 一 个 二 又 树 结构 ， 描 述 如 下 。 设 S$ 是 一 个 待 存储 区 间 的 集合 。 我 们 
选择 一 个 满足 下 述 条 件 的 中 间 值 center. PEME center 把 所 有 区 间 分 成 三 组 : 区 间 集 合 工 在 中 
PHE center WAM; 区 间 集 合 C 包含 中 间 值 center; KIRA R 在 中 间 值 center 的 右 侧 。 那 
么 ， 树 形 结构 的 根 用 递归 方式 保存 着 中 间 值 center 和 C， 其 左 侧 子 树 和 右 侧 子 树 分 别 保存 站 和 及 
(图 5.1 )。 

为 了 能 快速 响应 查询 ， 集 合 C 被 以 有 序列 表 的 形式 存储 。 列 表 by low 保存 了 C 中 按 开头 排 
列 顺序 的 区 间 ; 同时 ， 列 表 by high 保存 了 C 中 按 尾 排列 顺序 的 区 间 。 

为 了 响应 对 p 点 的 查询 ， 只 需要 把 p 与 中 间 值 center 比较 : WE p > center, MATAH 
递归 方式 在 左 侧 子 树 中 查找 包含 了 p 的 区 间 ， 并 在 其 中 添加 C 中 的 区 间 [1, A), HELS p XE 
正确 的 作法 ， 因 为 通过 构建 这 些 区 间 ， 满 足 h 二 > center， 也 就 满足 了 pe[1, hs AWM, we 
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p 宇 center， 则 需要 用 递归 方式 在 右 侧 子 树 中 查找 包含 p 的 区 间 ， 并 在 其 中 添加 C 中 的 区 间 [1， 
h), HÆ p <ho 





center 


3—7 














图 5.1 存储 7 个 区 间 的 树 


© 选择 中 间 值 center 

为 了 证 二 又 树 能 够 平衡 ， 我 们 可 以 选择 中 间 值 center 作为 要 存储 区 间 的 正中 元 素 。 这 样 一 
来 ， 一 半 区 间 就 会 被 存 进 右 侧 子 树 ， 保 证 深度 是 指数 级 别 的 。 与 快速 排序 算法 类 似 ， 如 果 中 间 值 
center 是 从 区 间 中 随机 选择 的 ， 则 期 望 性 能 也 将 是 类 似 的 "。 


°. 复杂 度 
构建 二 又 树 需 要 的 时 间 复 杂 度 为 O(logn)， 处 理 一 个 查询 所 需 时 间 为 O(logn+m)， 其 中 指数 部 分 
源 于 对 有 序列 表 的 二 分 查找 。 


e 实现 细节 

在 实现 中 ， 区 间 用 元 组 的 方式 时 现 ， 其 中 排 在 最 前 面 的 两 个 元 素 保存 着 区 间 的 首尾 边界 。 其 
他 元 素 可 用 于 传输 补充 信息 

二 分 查找 通过 方法 bisect J (t,x) 来 实现 ， 它 返回 了 i， 使 得 当 j > TINA i > x. HE 

， 不 要 使 用 子 列表 by_high[i:] 在 数组 by high 中 循环 ， 因 为 创建 长 度 为 len (by_high) 
的 子 列表 所 用 时 间 是 线性 的 ， Roe eee s 度 从 O(logntm) (m 是 返回 列表 的 大 小 ) 提升 至 
O(logntn)。 




































































© 这 和 快速 排序 算法 随机 选择 分 隔 点 对 性 能 的 影响 类 似 。 译 者 注 
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数组 保存 了 数值 对 (value, interval)， 所 以 我 们 使 用 bisect_high 方法 来 查找 格式 为 p, (ce , 00 )) 


一 个 元 素 x 的 插入 点 。 











class Node 


def 


def 


def init _ (self, center, by low, by high, left, right): 
self.center = center 
self.by low = by _low 
self.by high = by high 
self.left = left 
self.right = right 


interval _tree(intervals): 


# 下 面 的 测 I 试 会 降低 性 能 


# assert intervals == sorted (intervals) 




















if intervals == []: 

return None 
center = intervals[len(intervals) // 2] [0] 
L= [] 


Cc = [] 
for I in intervals: 
if I[1] <= center: 
L.append (I) 
elif center < I[0]: 
R.append (I) 
else: 
Cy |. ) 
by low = sorted ( js IJ för I in C) 
by_high = ue Ill]; Iy fox IT in C) 
IL = interval pe ) 
IR = interval_tree (R) 
return _Node (center, by_low, by_high, IL, IR) 


intervals_containing(t, p): 
INF = float('inf') 
if t is None: 
return [ ] 
if p < t.center: 
retval = intervals containing(t.left, p) 
J = bisect_right(t.by_low, (pr (INF, INF))) 
for i in range(j): 
retval.append(t.by low[i] [1] 
else: 
retval = intervals containing(t.right, p) 
i = bisect_right(t.by_high, (p, (INF, INF))) 
for j in range(i, len(t.by high)): 
retval.append(t.by high[j] [1]) 
return retval 
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5.2 区 间 的 并 集 


© 定义 
给 定 一 个 包含 n 个 区 间 的 集合 S$， 我 们 希望 确定 具有 多 个 非 连 接 区 间 有 序列 表 形式 的 并 集 
L, H Us =U, 


e 使 用 扫描 方式 复杂 度 为 O(nlogn) 的 算法 

从 左 向 右 扫描 区 间 临 界 值 。 在 每 个 给 定时 刻 ， 在 open 中 维护 开放 区 间 ( 尚未 看 到 结尾 的 区 间 ) 
的 数量 。 当 该 数量 变 为 零 后 ， 需 要 在 解 中 假设 一 个 新 区 间 [open, x]， 其 中 x 是 扫 子 的 通常 位 置 ， 
open 是 open 变 为 正 值 的 最 后 一 个 位 置 。 






































。 实现 细节 
记录 下 被 处 理 区 间 的 临界 值 顺序 。 当 区 间 是 封闭 或 半 开 时 ， 这 个 顺序 是 正确 的 。 对 于 开放 区 间 
而 言 ， 需 要 在 处 理 区 间 的 起 始 值 0 z) 之 前 处 理 区间 的 结束 值 Cc y) 























def intervals_union (S): 
E = [(low, -1) for(low, high) in S] 
E += [(high, +1) for(low, high) in S] 
nb _ open = 0 
last = None 


retval = [] 
for x, dir in sorted(E): 
if dir == =]: 
if nb_open == 0: 
last = x 
nb open += 1 
else: 
nb open == 1 
if nb_open == 0: 


retval.append((last, x)) 
return retval 











53 ”区 间 的 覆盖 


e 应 用 
假设 有 一 片 平 直 的 海滩 ,周围 是 数 座 如 点 一 样 小 的 岛屿 ， 我 们 希望 沿 着 海滩 放置 最 小 数量 的 天 
线 ， 让 信号 覆盖 所 有 岛屿 。 所 有 天 线 的 信号 覆盖 半径 都 是 x。 
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如 果 在 每 个 岛屿 周围 画 出 半径 x 的 范围 ， 我 们 就 能 在 海滩 上 找 出 必须 安装 一 个 天 线 的 区 间 。 问 
题 就 简化 为 以 下 问题 〈 岁 5.2 )。 


























< 





@) | @) 


图 5.2 ”需要 多 少 天 线 才 能 覆盖 所 有 岛屿 ? 问题 简化 为 区 间 覆 盖 问题 


e 时 间 复 杂 度 为 O(nlogn) 的 算法 
使 用 扫描 方式 ， 我们 从 右 侧 开 始 按 升序 方向 处 理 所 有 区 间 。 我 们 维护 一 个 解 S 来 保存 已 经 扫描 
过 的 区 间 ，5 的 最 小 值 是 |S|， 在 相等 极限 情况 下 的 值 是 maxs, 

算法 很 简单 ， 如 果 对 于 一 个 区 间 [Lr] lS maxS， 那 就 什么 都 不 做 ; 否则 ， 就 把 + 添加 入 5。 
思路 是 需要 想方设法 覆盖 [1, r]， 并 且 ， 通 过 选择 可 窗 六 区 间 的 最 大 值 还 能 增加 覆盖 后 续 待 处 理 区 间 
的 可 能 | 





























def interval cover (I): 
S = [J 
for start, end in sorted(I, key=lambda v: (v[1], v[0])): 
if not S or S[-1] < start: 
S.append (end) 
return S 

















图 是 由 顶点 集合 V 和 边 集 合 E 组 成 的 对 象 。 一 般 来 说 ， 边 与 两 个 不 同 的 项 点 对 相关 ， 并 且 边 





不 区 分 方向 ， 也 就 是 说 (u, v) 和 (v, u) 表示 的 是 同一 条 边 。 
有 时 我 们 会 考虑 一 个 变种 ， 即 有 向 图 ， 有 回 岁 的 边 是 有 方向 的 。 在 这 种 情况 下 ， 习 惯 上 称 边 为 








IR, IÅ (u, v) 的 起 点 是 wx， 终点 是 v。 本 章 的 大 多 数 算法 都 基于 有 向 图 的 操作 ， 但 也 可 能 把 边 (u, v) 
替换 成 两 条 弧 (u, vV) 和 (v, 四， 借 此 应 用 于 无 向 图 。 
图 也 可 以 包含 额外 的 信息 ， 比 如 在 顶点 或 边 上 标注 权重 或 字符 。 























6.1 使 用 Python 对 图 编码 


一 个 简单 方法 是 使 用 从 0 到 n-1 的 整数 来 区 分 个 顶点 。 但 在 输入 文件 里 显示 或 编码 的 时 候 ， 




















通常 从 1 开始 计数 。 读 者 要 注意 ， 在 读 取 和 显示 的 时 候 ， 记 得 在 下 标 中 添加 或 删除 1 个 下 标 。 
图 的 边 可 以 通过 邻接 数组 或 邻接 矩阵 这 两 种 方式 表示 。 邻 接 矩 阵 很 容易 实现 ， 但 更 占 空 间 。 在 
此 情况 下 ， 图 将 用 一 个 二 进 制 数 的 矩阵 卫 来 表示 ， 其 中 Elu, v 代表 存在 弧 (u, v) (图 6.1) 

















图 6.1 














| # 邻接 数组 
G= [1-2], 10,2,31, 00,1), 021] 


# i He xe BE 














G = [[0,1,1,0], 
[1,0,1,1], 
[1,1,0,0]; 
[0,1,0,0]] 

一 个 图 及 其 可 能 的 编码 方式 


邻接 数组 通过 一 个 数组 G 来 符号 化 一 个 图 。 对 于 顶点 &，C[ 呈 是 2 的 邻接 顶点 列表 。 我 们 同样 











可 以 借助 文本 标识 符 来 指示 顶点。 因此 ，G 可 以 是 一 个 字典 ， 其 中 的 键 是 字符 串 ， 值 是 邻接 顶点 列 


表 。 例 如 ， 如 果 三 角形 由 三 个 顶点 axel, bill 和 carl 组 成 ， 那 就 可 以 








] 以 下 字典 来 编码 "。 

















{'axel':['bill','carl'], ‘bill':['axel','carl'], 'carl' 


:['axel’, 'bill']} 








本 书 中 提 到 的 算法 通常 以 邻接 数组 为 基础 。 











在 有 向 图 中 ， 有 时 需要 两 个 数据 结构 G out 和 G in, 包含 每 个 节点 离开 的 弧 和 进入 的 弧 。 但 
是 ,我 们 会 储存 弧 的 顶点 而 非 狐 本 身 。 因 此 ， 对 于 任意 顶点 uw，G_out[lu] 包含 每 条 离开 的 弧 (u, v) 的 


顶点 数组 v，G in[u] 包含 每 条 进入 的 弧 (v, u) 的 顶点 数组 vo 





的 矩阵 。 这 样 一 来 ， 图 本 身 的 编码 结构 G 就 不 受 影 
况 下 用 于 代码 之 中 。 利 用 类 的 属性 来 表示 项 点 和 边 ， 

















6.2 使 用 C++ 或 Java 对 图 编码 





























使 用 





个 高 效 的 编码 方式 一 一 链 列 。 每 个 弧 使 











H, M G 也 可 以 在 不 被 修改 且 不 考虑 标签 的 情 
这 种 方式 对 高 效 编程 来 讲 就 非常 耗 时 了 。 











由 于 C++ 或 Java 标准 库 中 的 列表 和 字典 的 使 用 比较 麻烦 ， 而 且 速 度 也 有 点 慢 ， 因 而 我 们 提议 
] 一 个 下 标 e KRR, IA dest[e] HIM e 的 目标 顶 
点 。 离 开 顶 点 4 的 弧 将 以 下 述 方 式 组 织 成 链 列 。 列 表 中 的 第 一 


条 弧 是 arc[u]， 第 二 条 弧 是 


succ[arc[u]]， 第 三 条 弧 是 succ[succ[arc[u]]]， 以 此 类 推 >， 列 表 的 结尾 是 特殊 值 -1。 对 于 没有 离开 弧 

















的 顶点 u， 我 们 定义 arc[u]== -1。 

const int MAX NODES = 500; // 举例 
const int MAX ARCS = 2*MAX NODES*MAX NODES; // 举例 
int nb nodes = 0; 

int nb arcs = 0; 

int arc[MAX NODES] = {0}; 


succ[MAX ARCS], dest[MAX ARCS]; 


void clear graph(int n) { 
nb_nodes = n; 
nb arcs = 0; 














DQ 在 邻接 数组 中 ， 下 标 为 0 的 元 素 值 是 集合 1,2}, HACK 0 连接 着 元 素 1 和 2， 下 标 为 1 的 元 素 值 
是 集合 {0, 2, 3}， 说 明 元 素 1 连接 着 0、2 和 3， 其 他 元 素 以 此 类 推 。 在 邻接 天 阵 中 ， 可 以 看 到 矩阵 
沿 着 从 左上 角 到 右 下 角 的 锋线 呈 对 称 ,， NETO, HALK ipj 不 连通 ,等 于 1 说 明 i 和 j 连 
通 。 比 如 在 第 一 行 中 ，0 列 0 行 的 第 0 个 元 素 0 和 自己 不 连通 ，1 列 0 行 的 第 0 个 元 素 和 第 一 个 元 素 


2- FE 


连通 ，0 列 
推 。 译 者 注 


succ 是 单词 successor 的 前 级 ， 





@ 


2 行 等 于 1 说 明 0 和 2 连通 ,0 列 3 行 和 3 列 0 行 都 等 于 0， 说 明 0 和 3 不 连通 ， 以 此 类 


表示 用 一 种 递归 方式 定义 了 每 个 顶点 及 其 一 层 层 的 后 继 顶 点 。 





译 者 注 
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for(int v=0; v<nb_nodes; v++) 
arc[v] = -1; 
} 


void add_arc(int u, int v) { 


succ[nb_ arcs] = arcl[u]; 
dest[nb_ arcs] = v; 
arc[u] = nb _arcs++; 


} 


#define forall _neighbors(u, v) \ 
for(int e=arc[u]; e!=-1 && (v=dest[e], 1); e=succ[e]) 











6.3 ERE 


有 时 ， oe ea 其 中 图 的 项 点 是 网 格 的 一 个 个 单元 ， 而 边 由 网 格 
单元 间 的 邻接 关系 来 定义 ， 这 就 像 一 个 迷宫 。 相 关 对 象 是 男 一 种 隐 式 图 ， 其 中 的 弧 对 应 着 一 个 本 地 
的 改动 (一 个 对 象 被 改动 后 变 成 另外 一 个 对 象 


e 例子 : 高 峰 期 



























































图 6.2 一 局 “高 峰 期 ”游戏 
高 峰 期 ”是 一 种 能 在 商店 里 买 到 的 智力 游戏 。 棋 盘 是 一 个 6x6 的 网 格 (图 6.2 )。 棋盘 上 的 小 
轿车 (长 度 为 2) 和 大 卡车 〈 长 度 为 3 ) 停 在 网 格 中 。 和 车 里 没有 司机 ， 也 不 能 离开 网 格 的 范围 。 其 
中 一 辆 小 轿车 被 特别 标识 为 红色 ， 玩 家 的 目标 是 把 这 辆 小 轿车 从 网 格 侧面 唯一 一 个 出 口 挪 出 网 格 。 

为 了 实现 目标 ， 玩 家 可 以 向 前 或 向 后 移动 棋盘 中 的 所 有 车辆 "。 
我 们 马上 使 用 图 来 实现 建 模 。 在 大 辆 车 中 ， 每 一 辆 车 都 对 应 着 一 个 固定 模型 和 可 变 模型 ， 固 定 
模型 由 大 小 、 方 向 和 固定 位 置 组 成 ( 比如 一 辆 纵向 行驶 的 车 所 在 的 列 ) ;可 变 模型 由 自由 坐标 组 成 。 
所 有 自由 坐标 的 向 量 完整 地 编码 了 网 格 的 组 态 。 人 遍历 这 张 图 的 关键 函数 从 一 个 向 量 开始 ， 枚 举 了 所 

















Cy 





































































































QO 类 似 于 中 国 的 “华容 道 ”游戏 ， 通 过 移动 迷 官 中 的 长 短 块 ， 把 黑色 块 移出 迷 官 。 译 者 注 

















有 通过 一 步 移动 能 得 到 的 向 量 组 态 。 以 下 是 图 6.2 中 一 局 游戏 的 组 态 编码 "。 
orientat = [1,0,1,0,0,1,1,0,0,1,0] # 0= 横向 1= 纵向 。 方向 配置 
longueur = [2,3,3,3,2,2,2,2,3,2,2] # 2= 轿车 ，3= 卡车 长 度 配置 
coorfixe = [0,0,4,1,2,2,3,3,4,5,5] # 固定 坐标 ， 即 原始 出 发 点 
coorvari = [0,1,0,1,0,2,2,4,2,4,3] # 可 变 坐标 ， 移 动 后 的 坐标 

rouge = 4 # 红色 小 轿车 的 下 标 














比如 ， 如 果 orientat[i]=0, HBA X} F coorvari[i] < x < coorvari[i] + longueur[i] 以 及 y= 
coorfixe[ 相 ， 小 轿车 SAAS APA (x, y) 的 格子 。 如 果 orientat[7] = 1， 那 么 对 于 x = coorfixe[7] 以 及 
coorvari[7] < y < coorvari[i] + longueur[ 牛 ， 小 轿车 :占用 了 所 有 (x,y) 的 格子 。 














6.4 深度 优先 遍历 : 深度 优先 算法 


e 定义 

深度 优先 遍历 是 一 种 对 图 的 遍历 方法 ， 它 从 一 个 给 定 节点 开始 ， 以 递归 方式 遍历 该 节点 的 相 邻 
节点 。 深 度 优 先 算法 的 英文 全 称 是 Depth-first search， 简 称 DFS 算法 。 

SAE: 算法 的 时 间 复 杂 度 是 OVE 

















e 应 用 
深度 优先 算法 主要 用 于 从 图 中 找到 一 个 给 定 节点 能 够 到 达 的 所 有 节点 。 这 种 遍历 方式 也 是 本 书 
后 续 要 介绍 到 的 很 多 算法 的 基础 ， 比 如 ， 找 到 图 中 的 重 连通 分 量 或 拓扑 排序 ( 见 6.7 节 和 6.8 节 )。 


e 实现 细节 
为 了 不 重复 遍历 一 个 顶点 的 相 邻 节 点 ， 我 们 需要 使 用 一 个 布尔 型 数组 对 已 访问 过 的 节点 进行 标注 。 


def dfs recursive (graph, node, seen): 
seen[node] = True 
for neighbor in graph[node]: 
if not seen[neighbor]: 
dfs recursive(graph, neighbor, seen) 



































o 更 好 的 实现 

上 述 使 用 递归 的 实现 方式 不 能 处 理 较 大 的 图 ， 因 为 程序 的 调用 栈 是 有 限 的 。 在 Python 语言 中 ， 
setrecursionlimit 方法 让 我 们 能 稍微 突破 一 点 限制 ,但 总 的 来 说 ， 递 归 调 用 还 是 不 能 超过 数 
千 次 。 为 了 缓解 这 个 问题 、 提 高 效率 ， 可 以 采用 迭代 方式 的 实现 。 栈 to_visit 包含 所 有 被 发 现 
但 尚未 处 理 的 顶点 。 















































© orientat ŽA “Z”, longueur 意 为 “长 度 ”，coorfixe 意 为 “固定 坐标 "”，coorvari A TEER”, 
译 者 注 





rouge 意 为 “红色 ”。 
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def dfs_iterative(graph, start, seen): 
seen[start] = True 
to_visit = [start] 
while to visit : 
node = to_visit.pop() 
for neighbor in graph[node]: 
if not seen[neighbor]: 
seen[neighbor] = True 
to_visit.append (neighbor) 











e 网 格 的 情况 

假设 一 个 网 格 中 某 些 格子 是 可 以 通过 的 ( 使 用 字符 填充 )， 而 某 些 格 子 不 能 通过 ( 使 用 # 字符 
填充 )， 就 如 同一 个 迷宫 。 从 一 个 格子 开始 ， 我 们 可 以 抵达 其 周围 相 邻 的 4 个 格子 ; 位 于 边缘 的 格 
子 除外 ， 因 为 其 相 邻 格子 较 少 。 在 下 述 实现 中 ， 我 们 借助 这 个 网 格 ， 并 用 字符 开标 注 已 访问 过 的 格 
子 。 为 了 优化 可 读 性 ， 我 们 使 用 了 递归 遍历 方式 。 


def dfs_grid(grid, i, J; mark='X', free='.'): 
height = len(grid) 
width = len(grid[0] 
to visit = [(i, j)] 
grid[i][j] = mark 
while to visit: 
il, j1 = to_visit.pop() 












































for i2, j2 in[(il + 1, 31), (il, 31 + 1), 
(il - 1, 31), (41, 31 - 1)1: 

if 0 <= i2 < height and 0 <= j2 < width and grid[i2] [j2] == free: 

grid[i2] [j2] = mark # 标注 已 访问 状态 














to_visit.append((i2, j2)) 








65 广度 优先 遍历 : 广度 优先 算法 


e 定义 

与 其 从 当前 节点 开始 遍历 尽 可 能 远 的 距离 ( 深度 优先 )， 不 如 从 一 个 起 始 节 点 开始 ， 按 距离 升 
序 顺序 枚 举 一 个 图 的 所 有 节点 ( 广度 优先 )。 广 度 优先 算法 的 英语 全 称 为 Breadth-First Search， 简 称 
BFS 算法 。 
e 关键 测试 

我 们 从 初始 节点 开始 按照 距离 升序 处 理 所 有 节点 ， 因 此 ， 就 需要 一 个 能 够 维护 这 个 顺序 的 








数据 结构 。 队 列 是 一 个 不 错 的 选项 :如果 对 于 每 个 被 取出 作为 关 部 的 顶点， 我 们 都 把 其 相 邻 节点 
添加 到 尾部 ， 那 么 在 任意 情况 下 都 能 证 明 ， 该 项 点 在 头 部 只 包含 距离 为 4 的 节点 ,在 尾部 仅 包 


含 距离 为 4+1 的 节点 ; 只 要 距离 为 4 的 顶点 在 头 部 尚未 被 用 完 ， 那么 在 尾部 就 只 有 被 添加 的 距 











BN d+] 的 顶点 。 


e 时 间 复 杂 度 为 线性 的 O(M+IEl 的 算法 








广度 优先 算法 使 用 与 深度 优先 算法 相同 的 数据 结构 ， 但 有 两 个 差别 : 一 是 深度 优先 算法 使 用 














栈 ， 而 广度 优先 算法 使 用 队列 ; 二 是 在 广度 优先 算法 中 ， 顶 点 只 在 被 加 入 队列 








将 会 达到 一 个 二 次 方 的 复杂 度 。 








列 时 不 标注 ， 否 则 ， 内 存 的 使 


° 实现 细节 








时 被 标注 ， 在 离开 队 





广度 优先 算法 的 主要 好 处 是 ， 它 能 在 一 个 给 定 的 非 加 权 图 的 数据 源 中 确定 距离 。 算 法 的 实现 计 
算 了 这 些 距 离 ， 以 及 在 最 短路 径 树 形 结构 中 的 前 驱 顶 点 。 距 离 数 组 同样 也 用 于 标注 遍历 过 程 中 遇 到 





的 顶点 。 








from collections import deque 


def bfs(graph, start=0): 
to visit = deque() 


dist = [float('inf')] * len(graph) 
prec = [None] * len(graph) 
dist[start] = 0 


to_visit.appendleft (start) 
while to visit: 
node = to _visit.pop() 
for neighbor in graph[node]: 


if dist[neighbor] == float('inf'): 
dist[neighbor] = dist[node] + 1 
prec[neighbor] = node 


to_visit.appendleft (neighbor) 
prec 





return dist, 


# 一 个 空 的 队列 值 是 “ 假 ” 






























































e 定义 

如 果 对 于 A 中 的 顶点 wu 和 vwv， 存 在 一 条 从 wu 到 v 的 路 径 ， 那 么 图 中 满足 AcYV 的 部 分 被 称 作 连 
通 分 量 。 比 如 ， 我 们 可 以 计算 一 个 图 的 连通 分 量 。 当 图 中 只 存在 唯一 一 个 连通 分 量 的 时 候 ， 就 被 称 
作 连 通 图 。 

图 6.3 展示 了 用 ASCII Art 制作 的 CleanBandit 乐队 的 标识 “。 它 可 以 被 视 为 一 个 用 # 字 符 表示 项 
点 的 图 ， 而 且 ， 当 且 仅 当 两 个 顶点 垂直 或 水 平地 互相 接触 时 ， 这 两 个 顶点 才 被 一 条 边 连 接 。 这 个 图 
包含 4 个 连通 分 量 。 
®© ASCH Art 是 一 种 使 用 ASCII 字符 (包含 很 多 控制 字符 ) 拼接 组 合 形 成 文字 、 图 片 和 动画 的 艺术 表现 


形式 。 





译 者 注 
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和 3.....111111111 
1111111... 


图 6.3 对 Clean Bandit 乐队 的 标识 图 像 执 行 算法 前 和 执行 算法 后 的 网 格 状态 " 


ay FA 
BaF LS, Ri 








数 。 为 了 达到 目的 ， 我 们 用 灰 度 色 阶 将 该 图 像 色调 分 离 〈 即 减少 颜色 的 数量 
分 量 (图 








图 片 ， 让 山子 的 每 个 点 都 对 应 图 片 中 的 一 个 连通 


] 从 垂直 方向 给 奶子 拍摄 照片 ， 并 希望 用 


Pt 














6.4 )o 












































































































































图 6.4 


© 深度 优先 算法 
深度 优先 遍历 从 顶点 开始， 并 且 只 





能 遍历 从 zx F 





一 个 角子 的 照片 和 海报 化 后 的 图 片 


始 可 以 抵达 的 所 有 顶点 。 所 以 ， 连 通 








简单 方法 确定 反面 的 点 
A )， 以 此 获取 一 个 黑白 





量 一 
































定 包含 u。 我 们 以 当前 分 量 的 编号 作为 访问 标记 。 
def dfs grid(grid, i, J; mark, free): 
grid[i][j] = mark 
height = len(grid) 
width = len(grid[0] 
for ni, nj in[(i + 1, j), (i, j + 1), # 四 个 相 邻 节点 
(i= 1, the (ap a= 2s 
if 0 <= ni < height and 0 <= nj < width: 
if grid[ni] [nj] == free: 
dfs _grid(grid, ni, nj, mark, free) 
DO ”注意 ， 每 个 连通 分 量 中 的 元 素 都 用 其 编号 来 填充 。 译 者 注 














只 要 有 连通 分 量 ， 我 们 就 一 直 执行 深度 优先 遍历 。 横 向 和 纵向 遍历 网 格 ， 一 旦 遇 到 一 个 包含 # 








号 字符 的 格子 ， 我 们 就 知道 遇 到 了 一 个 连通 分 量 。 然 后 ， 从 这 个 格子 开始 深度 优先 遍历 ， 确 定 连 通 
分 量 的 所 有 组 成 元 素 。 




















def nb connected components grid(grid, free='#'): 


nb components = 0 
height = len(grid) 
width = len(grid[0] 
for i in range (height): 
for j in range (width): 
if grid[i][j] == free: 

nb components += 1 

dfs_grid(grid, i, j, str(nb components), free) 
return nb components 














每 个 包含 # 字 符 的 格子 仅 会 被 访问 一 次 ， 所 以 算法 的 复杂 度 是 O(|V|), HDL, 1 MAES 


顶点 数量 成 线性 关系 。 
© 使 用 并 查 集 结构 的 算法 


这 个 图 是 无 向 图 ， 所 以 “u 和 v 之 间 存 在 一 条 路 径 ” 和 “vy 和 之 间 存 在 一 条 路 径 ” 成 等 价 关 














系 。 因 此 ， 连 通 分 量 就 是 这 一 关系 的 等 价 类 型 。 因 此 ， 并 查 集 是 一 个 非常 适 于 展示 问题 的 数据 结构 
(JL 1.5.5 节 )。 


° 复杂 度 








并 查 集结 构 算法 的 复杂 度 比 深度 优先 算法 略 差 。 然 而 ， 假 如 要 处 理 的 图 的 边 数 会 变动 ， 而 且 需 








lay 





要 随时 知道 连通 分 量 的 数量 ， 那 么 并 查 集结 构 算法 就 十 分 必要 。 








def nb connected components (graph): 


n = len(graph) 

uf = UnionFind(n) 

nb components = n 

for node in range(n): 

for neighbor in graph[node]: 
if uf.union(node, neighbor): 
nb components -= 1 

return nb components 








e 对 一 个 图 断 开 的 应 用 


序列 ey, em， 比如 边 ;会 在 i 时 刻 消失 。 我 们 希望 找到 一 个 时 间 点 ， 从 这 一 刻 开 始 ， 图 不 再 








x 





假设 一 个 图 的 边 会 随 着 时 间 逐 渐 消失 ， 也 就 是 说 ， 这 个 图 是 一 个 随时 间 i 前 进而 消失 的 边 的 
是 


tit 


通 的 。 


边 





我 们 在 时 间 t+=1E1 (GR | V1 个 连通 分 量 ) 从 无 边 图 开始 。 在 每 个 步骤 中 ， 我 们 添加 一 条 











并 观察 连通 分 量 的 数量 是 否 变化 。 当 连通 分 量 的 数量 变 成 1 时， 我 们 知道 图 已 经 变 成 定义 上 的 连 





， 而 且 z+ 1 就 是 我 们 需要 找 的 值 。 
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6.7 NES 











az a 
输入 
a 
输出 
e 应 用 
给 定 一 个 图 ， 图 中 每 个 顶点 和 每 条 边 被 破坏 掉 时 都 有 一 个 成 本 值 ， 我 们 希望 找到 唯一 一 个 顶点 























或 者 唯一 一 条 边 ， 以 便 在 把 图 变 得 不 连通 时 成 本 最 低 。 注 意 ， 这 个 问题 和 寻找 一 个 边 数 最 小 的 集合 
来 断 开 图 的 问题 有 区 别 ， 后 者 是 本 书 9.8 方 要 介绍 的 最 小 切割 问题 。 
e EX: 这 是 一 个 无 向 连通 图 。 

一 断 开 连接 的 顶点， 又 称 衔接 点 ， 被 删除 后 就 使 图 不 再 连通 。 

一 断 开 连接 的 边 ， 又 称 桥 ， 被 删除 后 就 使 图 不 再 连通 (图 6.7 )。 

一 双 连 通 分 量 是 一 个 包含 最 大 数量 边 的 集合 ， 对 于 一 个 〈 被 限制 在 该 边 集合 和 所 有 邻接 顶点 

范围 内 的 ) 图 来 说 ， 既 不 存在 一 条 断 开 连接 的 边 ， 也 不 存在 一 个 断 开 连接 的 顶点 。 
一 不 是 桥 的 边 ， 分 布 于 双 连 通 分 量 之 间 。 































































































一 个 双 连 通 分量 S 还 有 以 下 特性 : 对 于 所 有 顶点 对 (s, DeES， 一 定 存在 从 s 到 1 且 通 过 不 同 顶 点 
的 两 条 不 同 路 径 。 注 意 ， 双 连通 分 量 是 由 一 部 分 边 定 义 的 ， 而 不 是 由 一 部 分 顶点 定义 的 。 其 实 ， 一 
个 顶点 可 以 属于 多 个 双 连 通 分 量 ， 如 图 6.6 中 的 顶点 5。 


对 于 一 个 给 定 的 无 向 图 ， 我们 要 把 它 拆 分 成 多 个 双 连 通 分 量 。 
复杂 度 : 使 用 深度 优先 算法 的 复杂 度 是 线性 的 ( 见 参 考 文献 [14] )。 


e 细致 的 深度 优先 遍历 
在 上 文中 ， 我 们 描述 了 图 的 深度 优先 算法 。 现 在 ， 要 在 顶点 和 边 上 增加 附加 信息 。 首 先 ， 顶 点 
按照 被 处 理 的 顺序 编号 。 数 组 dfs_num 保存 了 这 个 信息 。 
为 每 条 边 都 生成 两 条 弧 ， 一 个 无 向 图 就 可 以 表示 为 有 向 图 。 深 度 优先 算法 遍历 了 图 的 所 有 边 ， 
我 们 用 下 面 描述 方 式 区 分 这 些 边 ( 图 6.5 )。 






























































图 6.5 顶点 按照 被 处 理 的 顺序 编号 ， 保 存在 dfs_ 


num 中 。 实 线 表示 连接 弧 ， 虚 线 


表示 回 到 顶点 的 弧 ， 点 虚线 表示 离开 顶点 的 弧 。 对 于 每 个 连接 弧 (u,v) 都 存 
在 着 一 个 反 向 连接 (v, x)， 为 阅读 方便 ， 这 个 反 向 连接 没有 在 图 上 标 出 


一 条 弧 (u, v) 可 呈现 以 下 形式 。 

一 连接 弧 : 如 果 在 处 理 w 的 时 候 , v 被 第 一 次 遇 到 。 
又 称 作 DFS 树 。 

一 反 向 连接 弧 : 如 果 (v, u) 是 一 条 连接 弧 。 

















连接 弧 在 遍历 图 的 过 程 中 形成 了 履 盖 树 ， 





一 返回 弧 : 如 果 v* 已 经 被 遇 到 ， 且 它 在 DFS APE u 的 祖先 。 

一 离开 弧 : 如 果 v 已 经 被 遇 到 ， 且 它 在 DFS 树 中 是 zx 的 后 代 。 

在 有 向 图 的 一 次 深度 优先 遍历 中 ， 还 额外 存在 一 类 弧 一 一 跨越 弧 ， 它 通 向 一 个 已 经 遇 到 的 顶点 ， 
但 该 顶点 既 不 是 祖先 顶点 也 不 是 后 代 项 点 。 我 们 在 本 节 中 不 考虑 无 向 图 ， 因 此 可 以 忽略 这 类 弧 。 



































o 确定 弧 的 类 型 
通过 比较 dfs_num 两 端的 值 ， 很 容易 确定 弧 的 类 型 ( 

































































图 6.6 )。 具 体 来 讲 ， 对 于 每 个 顶点 v， 除 


了 dfs_num[v]， 我 们 还 要 确定 算法 的 关键 值 之 一 dfs_low[v]。 它 被 定义 为 ， 当 w 是 v 的 后 代 时 ， 所 
有 返回 弧 (w, u) 的 dfs_num[u] 最 小 值 。 因 此 ， 这 个 最 小 值 可 从 顶点 xz 取 到 。 通 过 一 个 (可 以 为 空 
的 ) 连接 弧 序 列 ， 并 经 过 一 条 返回 弧 后 从 v 可 以 抵达 顶点 wu。 如 果 没 有 这 种 顶点 wu， 我 们 定义 dfs_ 














num[u] = °°, 











图 6.6 所 有 顶点 被 标注 了 dfs_num 和 dfs_low， 加 粗 的 顶点 和 边 是 


不 连通 的 顶点 和 边 


关键 测试 : 上 述 这 个 值 被 用 来 确定 项 点 和 不 连通 边 。 











L 一 个 项 点 是 DFS 树 的 根 节 点 ， 当 且 仅 当 它 在 树 中 拥有 至 少 两 个 子 节点 时 ， 它 是 不 连通 节 
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| 
点 。 每 个 子 节点 v 都 满足 dfs_low[v] = dfs_num[w]. 
2. 一 个 顶点 4 不 是 DFS 树 的 跟 节点 ， 当 且 仅 当 它 在 树 中 拥有 至 少 


Ny 














+ 


了 节点 v， 且 满足 dfs_ 











sq ya 


low[v] = dfs_num[u] 时 ， 它 是 不 连通 节点 。 
3. 一 条 边 (u,v) (交换 了 wu 和 旁边 的 v)， 当 且 仪 当 (u,v) 是 一 条 连接 弧 且 满足 dfs_ 
low[u] = dfs num[v] 时 ， 它 是 一 条 不 连通 边 。 
为 了 确定 双 连 通 分 量 ， 只 需 在 开始 一 个 新 双 连 通 分 量 的 时 候 应 用 上 述 定 义 即 可 (图 6.7 )。 
































图 6.7 两 个 不 连通 节点 中 间 的 一 条 边 不 总 是 一 条 不 连通 边 ， 一 条 不 
连通 边 的 两 端 也 不 总 是 不 连通 节点 

















father 数组 包含 了 DFS 树 中 每 个 顶点 的 前 驱 ， 而 且 也 可 以 确定 DFS 树 的 跟 节点 。 对 于 每 个 顶点 
u， 我 们 在 critical_childs[w] 中 记录 子 节 点 > 在 树 中 的 数量 ， 且 dfs_low[v] > dfs_num[u]。 在 确定 每 
个 从 vv 出 发 的 返回 弧 时 ，dfs_low[v] 的 值 被 更 新 。 在 处 理 的 最 后 ， 这 个 值 被 传播 向 DFS 树 中 的 
父 顶点 。 

































































# pour faciliter la lecture les variables sont sans préfixe dfs_ 
def cut nodes edges (graph): 
n = len(graph) 
time = 0 
num = [None] * n 
low = [n] * n 
father = [None] * n # father[v] = 工 的 父 节 点 ， 如 果 它 是 跟 节 点 则 是 none 
critical childs = [0] * A # c_childs[u] = nb fils v tq low[v] >= num[u] 
times seen = [-1] * ñ 
for start in range(n): 
if times _seen[start] == -1: # 初始 化 DFS 遍历 
times seenl[lstart] = 0 
to visit = [start] 
while to visit: 
node = to visit[-1] 
if times _seen[node] == 0: # 开始 处 理 
num[{node] = time 
time += 1 
low[node] = float('inf') 
children = graph[node] 
if times _seen[node] == len(children): # 结束 处 理 
































if critical_childs[node] >= 1: 
cut_nodes.append (node) 
if low[node] >= num[node]: 


return cut_nodes, 





cut_edges 


cut_edges.append((father[node], 

















node) ) 


第 6 章 77 
to_visit.pop() 
up = father [node] # 把 下 层 传播 到 父 节 点 
if up is not None: 
low[up] = min(low[up], low[node]) 
if low[node] >= num[up]: 
critical childs[up] += 1 
else: 
child = children[times_seen[node] ] 一 条 弧 
times _seen[node] += 1 
iff times seen[child] == -1: # 还 没 访问 过 
father[child] = node # 连接 弧 
times _seen[child] = 0 
to_visit.append (child) # (EA) 返回 弧 
elif num[child] < num[node] and father[node] != child: 
low[node] = min(low[node], num[child]) 
cut_edges = [] 
cut_nodes = [] # 输出 结果 
for node in range (n) : 
if father[node] == None: # 特征 
if critical childs[node] >= 2: 
cut_nodes. append (node) 
else: # 内 部 节点 








6.8 ”拓扑 排序 


输入 


° 定义 


给 定 一 个 有 向 图 G(V, A)， 我 们 希望 把 顶点 按照 等 级 排序 ， 使 得 对 于 每 


ru) < r(v)o 





输出 出 





条 弧 (u, v)， 都 有 


78 | 高 效 算法 : 竞赛 、 应 试 与 提高 必修 128 例 


e 应 用 








图 可 以 表示 一 系列 任务 ， 其 中 从 到 vv 的 弧 (xz 一 v) 表示 了 wu 和 vw 之 间 的 依赖 关系 ， 即 “一 


定 要 在 v 之 前 执行 w”。 我 们 关心 的 是 满足 依赖 关系 的 任务 执行 顺序 。 
首先 有 儿 点 注意 事项 。 
一 同一 个 图 存在 多 种 拓扑 排序 方式 。 比 如 ， 如 果 序 列 s G 的 拓扑 排序 ， 而 上 是 G 的 拓扑 排 
FR, 那么 st 和 都 是 G 和 G, 的 并 集 组 成 的 图 的 拓扑 排序 。 
一 一 个 包含 环 的 图 上 不 能 接纳 拓扑 排序 : 环 的 每 个 顶点 都 需要 在 其 他 项 点 前 被 处 理 。 
一 一 个 不 包含 环 的 图 至 少 能 接纳 一 种 拓扑 排序 ， 详 见 下 面 的 分 析 。 
复杂 度 : 输入 数据 大 小 决定 的 线性 复杂 度 。 


e 使 用 深度 优先 遍历 的 算法 












































如 果 只 在 处 理 完 一 个 顶点 的 所 有 相 邻 节点 之 后 才 处 理 顶 点 ， 我 们 就 能 得 到 一 个 反 向 拓扑 排序 。 
KE, WÈ u> v 是 一 个 依赖 ,那么 : 
— HA v Eu 之 前 被 遍历 ， 此 时 v 已 被 处 理 过 ( 否则， 这 意味 着 从 v 可 以 抵达 uu， 那 么 图 中 包 


含 一 个 环 )， 而 目 





-逆序 的 拓扑 顺序 被 满足 ; 


一 要 么 是 从 zx 开始 遍历 到 v， 此 时 会 在 v 之 后 被 处 理 ， 逆 序 拓扑 排序 再 次 被 满足 。 





HUT 























i 介绍 过 的 深度 优先 遍历 在 此 处 适用 ， 因 为 它 不 能 确定 项 点 被 处 理 的 结束 日 期 。 

















以 下 实现 方式 使 用 数组 seen， 数 组 用 -1 值 来 表示 每 个 未 被 遇 到 的 顶点 ; 否则， 这 个 值 指出 的 是 已 
被 遍历 顶点 的 直接 后 代数 量 。 当 这 个 计数 器 与 某 个 节点 的 子 节 点 数量 一 致 时 ， 对 该 节点 的 处 理 就 结 
了 ， 然 后 它 就 会 被 添 入 序列 order。 该 序列 保存 着 一 个 反 向 拓扑 排序 ， 必 须 在 算法 结尾 处 把 该 排序 逆转 。 














def topological _ order dfs (graph): 
n = len(graph) 
order = [] 
times seen = [-1] 
for start in range(n): 


return order[: 





if times_seen[start] = 
times _seen[start] 


to_visit 


* 


= 
0 


= [start] 


while to visit: 


node 


= to_visit[-1] 


children = graph[node] 


if times_seen[node] 


to_visit.pop() 
order.append (node) 
else: 


child = children[times_seen[node] ] 


times _seen[node] += 1 


if times_seen[child] == -1: 


times _seen[child] 


to_visit.append (child) 
期 


== len(children): 


= 0 








e 贪 禁 算法 

一 个 替代 方案 基于 顶点 的 输入 度 。 设 想 一 个 无 环 图 。 直 观 可 知 ， 我 们 首先 把 所 有 无 前 驱 节 点 的 
节点 强制 加 入 结果 序列 ， 然 后 将 其 从 图 中 删 掉 ， 再 把 图 中 无 前 驱 节 点 的 新 节点 加 入 结果 序列 ， 以 此 
类 推 。 这 个 过 程 最 终 会 结束 ， 因 为 一 个 无 环 图 总 存在 一 个 无 前 驱 节 点 的 顶点 ， 而 且 删 除 一 个 节点 仍 
能 保持 图 中 没有 环 。 
def topological order (graph): 

V = range (len(graph) ) 

indeg = [0 for in V] 

for node in V: # 确定 输入 度 


for neighbor in graph[node]: 
indeg[neighbor] += 1 












































Q = [node for node in V if indeg[node] == 0] 
order = [] 
while Q: 
node = Q.pop() # 没有 进入 弧 的 顶点 








order.append (node) 
for neighbor in graph[node]: 
indeg[neighbor] -= 1 
if indeg[neighbor] == 0: 
Q.append (neighbor) 
return order 











e 应 用 

给 定 一 个 无 环 图 和 两 个 顶点 Alt, 我 们 希望 计算 从 s 到 + 的 路 径 数量 ,或 者 当 弧 上 有 权重 时 ， 
找到 最 长 ”的 一 条 路 径 。 一 个 线性 时 间 复 杂 度 的 算法 使 用 了 拓扑 排序 ， 并 能 按 此 顺序 在 节点 上 应 用 
动态 规划 。 
比如 ， 动 态 规划 PEs] = 0, Piv] = 1+max,P[z] 计算 了 从 到 上 的 最 长 路 径 ， 其 中 ， 最 长 值 的 计 
算 基于 所 有 进入 v 节点 的 弧 (u, v)o 




















6.9 强 连通 分 量 


° 定义 
对 于 有 向 图 的 一 部 分 Ac<U ， 当 A 中 所 有 顶点 对 (u, v) 都 包含 着 A 内 一 条 连接 从 zw 到 v 的 路 径 
时 ，A 就 被 称 为 强 连 通 分 量 。 注 意 ， 在 这 种 情况 下 同样 存在 一 条 路 径 连 接着 从 v 到 wx (图 6.8 )。 











© 即 权重 最 大 。 
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图 6.8 一 个 图 的 一 部 分 是 强 连 通 分 量 


e 关键 测试 
分 量 图 是 所 有 强 连 通 分 量 收缩 成 超 顶 点 后 的 结果 。 分 量 图 是 无 环 的 ， 因 为 每 个 有 向 图 的 环 都 包 
含 在 唯一 一 个 强 连通 分 量 中 。 
复杂 度 : 使 用 以 下 算法 能 得 到 线性 复杂 度 。 
e Tarjan Biz: 
Tarjan 算法 〈 见 参考 文献 [27] ) 只 执行 一 次 深度 遍历 ， 并 把 所 有 顶点 按照 处 理 的 时 间 顺 序 编号 。 
算法 同样 会 把 遍历 中 遇 到 的 顶点 放 入 waiting 栈 ， 直 到 这 些 顶点 能 被 分 组 到 某 个 强 连 通 分 量 中 。 当 
检测 到 一 个 分 量 时 ， 就 把 它 从 waiting 栈 中 删 掉 。 这 意味 着 ， 所 有 已 被 发 现 的 分 量 的 进入 弧 都 会 被 
忽略 掉 。 
一 次 深度 遍历 会 通过 第 一 个 顶点 vy 进入 一 个 分 量 C， 然 后 遍历 分 量 中 所 有 的 顶点 ， 甚 至 会 遍历 
所 有 可 以 从 C 到 达 的 顶点 。 当 顶点 w 在 DES 树 中 的 所 有 后 代 节 点 都 被 处 理 完毕 时 ， 对 顶点 vo 的 处 
理 结束 。 从 结构 上 看 ， 显 然 在 vo 处 理 结 束 的 时 候 ，waiting RE w 之 上 ， 包 含 着 所 有 C 的 顶点 。 我 
们 把 waiting 栈 称 为 C 的 代表 点 。 顶 点 按照 处 理 顺序 编号 ， 因 此 C 的 代表 点 编导 最小。 问题 难 在 如 
何 找到 一 个 分 量 的 代表 点 。 
























































































































































号 dfs_num[v]; 男 一 个 是 dfs_min[y]， 即 所 有 尚未 分 人 一 个 强 连 通 分 量 的 顶点 二 的 dfs_num[u] 最 小 
值 。 这 些 顶点 仍 在 等 待 分 组 。 从 顶点 v 出 发 ,通过 一 系列 连接 弧 就 能 达到 这 些 顶 点 ， 而 这 些 连 接 弧 
之 后 很 可 能 跟着 唯一 一 个 返回 浙 ， 返 回 到 vy。 因此，dfs_min[v] 值 也 被 定义 为 所 有 离开 弧 (v, u) 的 最 
小 值 。 
































dfs _num[v] 
dfs_min[v]:= min dfs_ min[u] 如 果 (wu) 是 一 条 连接 弧 

dfs_num{u] 如 果 (wz 是 一 条 返回 弧 
注意 ， 这 个 值 与 6.7 节 中 描述 的 dfs_low[v] 不 同 ， 后 者 不 存在 等 待 分 组 的 顶点 概念 ， 而 且 dfs_ 
low[v] 可 以 取 值 ce。 





























假设 一 个 没有 离开 弧 的 分 量 C 和 一 个 顶点 veC。 同 时 假设 A 为 根 节点 是 v 的 DFS 子 树 ， 而 且 








在 v 之 前 存在 一 条 离开 A 并 指向 顶点 的 返 


的 代表 点 。 在 这 种 情况 下 ， 我 们 有 iy ini < dfs num[v], 404 


























回 弧 。 由 于 C 没 有 离开 弧 , u 是 C 的 一 部 分 | 





























H v 不是 C 
不 存在 离开 A 的 返回 弧 ， 那 么 A 
















































































包含 一 个 强 连 通 分 量 。 由 于 A 在 C 之 内 ， 这 棵 树 就 覆盖 了 C， 而 v 就 是 C 的 代表 点 。 在 dfs_ 
min[vj==dfs_num[v] 时 ， 就 可 以 看 到 这 种 情况 。 
o 实现 细节 
在 维护 ape 栈 的 同时 ， 算 法 维护 一 个 布尔 型 数组 waits， 用 于 在 常数 时 间 内 检测 顶点 是 否 已 
经 人 栈 。 因 此 ， 通 过 把 相关 进入 弧 设 置 为 False， 很 容易 就 能 把 一 个 顶点 从 图 PU T 
算法 返 ee 该 数组 包含 每 个 分 量 的 顶点 。 注 意 ， 这 些 分 量 是 通过 反 疝 拓扑 顺序 古 
定 的 。 我 们 后 面 求解 一 个 2-SAT 方程 时 ， 会 用 到 这 个 算法 。 
def tarjan recursif (graph): 
global sccp, waiting, dfs time, dfs_ num 
sccp = [] 
waiting = [] 
waits = [False] * len(graph) 
dfs time = 0 
dfs num = [None] * len(graph) 
def dfs (node): 
global sccp, waiting, dfs_time, dfs_num 
waiting.append (node) # 新 的 等 待 顶点 
waits[node] = True 
dfs_num[node] = dfs time # 标注 顶点 已 经 被 访问 过 
dfs_time += 1 
dfs min = dfs_num[node] # 计算 dfs_min 
for neighbor in graph[node]: 
if dfs_num[neighbor] == None: 
dfs min = min(dfs min, dfs (neighbor) ) 
elif waits[neighbor] and dfs min > dfs_num[neighbor]: 
dfs min = dfs _num[neighbor] 
if dfs min == dfs_num[node]: # 一 个 分 量 的 代表 点 
sccp.append([]) # 新 建 分 量 
while True: # 把 等 待 顶 点 加 入 分 量 
u = waiting.pop() 
waits[u] = False 
sccp[-1] .append(u) 
if u == node: # 直到 代表 点 
break 
return dfs min 
for node in range (len (graph)): 
if dfs_num[node] == None: 
dfs (node) 
return sccp 
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通过 


就 是 说 
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e 和 迭代 版 本 
比如 在 处 理 100 000 个 顶点 的 大 图 时 
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， 需 要 使 用 算法 的 迭代 版 本 。 这 里 计数 絮 times_seen 能 








标注 项 点 是 否 被 遇 到 ， 同 时 记录 已 被 计算 过 的 相 邻 节点 数量 。 
def tarjan (graph): 
n = len(graph) 
dfs num = [None] * n 
dfs min = [n] * n 
waiting = [] 
waits = [False] * n # 常量 : waits[v] 表示 v 是 否 在 等 待 处 理 
sccp = [] # 已 经 确定 的 分 量 数组 
dfs time = 0 
times seen = [-1] * ñ 
for start in range(n): 
if times seen[start] == -1: # 遍历 初始 化 
times seenl[lstart] = 0 
to_visit = [start] 
while to visit 
node = to visit[-1] # 顶点 的 栈 
if times seen[node] == 0: # 开始 处 理 
dfs _num[node] = dfs time 
dfs_min[node] = dfs time 
dfs _ time += 
waiting.append (node) 
waits[node] = True 
children = graph[node] 
if times _seen[node] == len (children): # 结束 处 理 
to_visit.pop() # 出 栈 
dfs min[node] = dfs_num[node] # 计算 dfs_min 
for child in children: 
if waits[child] and dfs_min[child] < dfs_min[node]: 





dfs_min [node] 


if dfs_min [node] 


component 


while True: 


u 


waits[u 


component .append (u) 
if u == node: 
break 
sccp.append (component) 


else: 
chita 


waiting.pop () 


] 


chilaren [times_seen[node]] 


times_seen [node] 


if times_seen[child] 
times_seen[child] 
to_visit.append (child) 





return sccp 















































= dfs_min[child] 
== dfs_num[node]: 


[] 


代表 点 
新 建 分 量 
新 增 顶点 


DLS 





He 


False 











到 代表 点 











+= 1 


还 没有 访问 过 





0 








e Kosaraju 算法 

Kosaraju 提出 了 一 种 不 同 的 算法 ( 见 参考 文献 [20] )， 复 杂 度 同样 是 线性 的 。 在 现实 中 ， 
Kosaraju 算法 的 复杂 度 与 Tarjan 算法 接近 ， 但 更 容易 理解 。 

算法 的 核心 在 于 首先 执行 一 次 深度 优先 遍历 ， 然 后 在 把 所 有 弧 反 向 后 的 图 上 执行 第 二 次 深度 
优先 遍历 。 通 常 ， 公 式 AT:= {(v, uu, v)eA} 记录 了 所 有 弧 反 向 之 后 的 结果 。 算 法 分 为 以 下 两 个 

1， 对 GCV, A) 执行 深度 优先 遍历 ,使 用 f[v] 来 记录 处 理 顶点 v 的 结束 时 间 。 

2， 对 G(V, AD 执行 深度 优先 遍历 ， 以 了 [v] 降序 排列 后 的 根 节点 v 作为 遍历 源 点 。 

在 第 二 次 遍历 中 ， 每 个 遇 到 的 树 形 结构 都 是 一 个 强 连 通 分 量 。 

验证 算法 的 基本 思路 是 ， 如 果 把 每 个 强 连通 分 量 C 与 整数 F(C):= max, ccf, 相关 联 ， 那 么 F 能 通 
过 处 理 G(V, AD 的 强 连通 分 量 ， 得 到 一 个 拓扑 排序 。 因 此 在 第 二 次 遍历 中 ， 每 个 树 形 结构 都 留 在 一 
个 分 量 内 部 ， 因 为 只 有 离开 弧 会 指向 已 访问 过 的 分 量 。 
























































e 实现 细节 
数组 sccp (strongly connected component ) 包含 了 所 有 强 连通 分 量 的 列表 。 








def kosaraju_dfs(graph, nodes, order, sccp): 
times seen = [-1] * len(graph) 
for start in nodes : 


if times seen[start] == -1: # 初始 化 深度 优先 遍历 
to_visit = [start] 
times _seen[start] = 0 


sccp.append([start]) 
while to visit: 
node = to visit[-1] 
children = graph[node] 
if times_seen[node] == len (children): # 结束 处 理 
to_visit.pop () 
order.append (node) 
else: 
child = children[times_seen[node] ] 
times _seen[node] += 1 
if times seen[child] == -1: # 新 节点 
times_seen[child] = 0 
to_visit.append (child) 
sccp[-1] .append (child) 





def reverse(graph): 
rev_graph = [[] for node in graph] 
for node in range(len(graph) ): 
for neighbor in graph[node]: 
rev_graph[neighbor] .append (node) 
return rev_graph 


def kosaraju(graph): 











84 | 高 效 算法 : 竞赛 、 应 试 与 提高 必修 128 例 

















n = len(graph) 

order = [] 

sccp = [] 

kosaraju_dfs(graph, range(n), order, ) 
kosaraju_dfs(reverse(graph), order[::-1], [], sccp) 
return sccp[::-1] # 使 用 拓扑 逆序 

















6.10 ”可 满足 性 


很 多 决策 问题 都 可 以 采用 “是 否 满足 布尔 方程 ”的 思路 来 建 模 ， 这 就 是 可 满足 性 问题 。 
e 定义 


假设 有 个 布尔 型 变量 。 一 个 命题 是 一 个 变量 或 一 个 变量 的 逆 值 。 一 个 语句 是 多 个 命题 的 “或 























是 
组 合 "， 也 就 是 说 ， 当 至 少 有 一 个 命题 为 真 时 ， 这 个 语句 成 立 。 一 个 公式 是 多 个 命题 的 “与 组 合 ”， 
也 就 是 说 ， 只 在 所 有 命题 都 为 真 时 ， 这 个 公式 成 立 。 最 终 目的 是 弄 清 是 否 存 在 某 个 给 变量 赋值 的 方 
IN, 使 方程 成 立 。 

当 每 个 语句 都 最 多 包含 两 个 命题 时 ， 一 个 方程 就 被 定义 为 2-SAT 级 别 。 信 息 科学 的 一 个 基础 问 
题 就 是 ， 能 否 证 明 在 线性 时 间 内 找到 使 一 个 2-SAT 方程 成 立 的 结果 ， 然 而 一 般 来 说 ( 以 3-SAT 方程 
为 例 )， 我 们 在 最 坏 情况 下 不 知道 在 多 项 式 时 间 内 解决 问题 的 算法 。 

复杂 度 : 线性 。 


e 使 用 有 向 图 建 模 
两 个 命题 的 逻辑 或 (x Vy) SHIP eS y, EBV Sx. RIMES TA S—F 2-SAT Ù 
程 相关 ， 其 中 顶点 是 命题 ， 弧 与 语句 等 价 。 图 6.9 展现 了 严格 的 对 称 性 。 



























































avb 
bvc 
avc 
avc 





图 6.9 2-SAT 实例 图 。 图 中 有 两 个 强 连 通 分 量 ， 下 方 分 量 指向 上 方 分 量 。 因 此 ， 把 
下 方 所 有 命题 赋值 为 false， 并 把 上 方 所 有 命题 赋值 为 tue， 就 能 使 方程 成 立 


o 关键 测试 


很 容易 证 明 ， 如 果 在 等 价 图 中 存在 一 个 变量 x， 并 存在 一 条 从 * 到 元 的 路 径 和 一 条 到 x 的 路 
径 ， 那 么 2-SAT 方程 不 成 立 。 出 人 意料 的 是 ， 这 个 命题 的 逆 命 题 同样 成 立 。 
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由 于 关联 有 传递 性 ， 因 为 当 方 程 能 推导 出 x 过 莽 过 x 时 ,方程 不 可 能 成 立 。 因 为 每 次 把 x 赋值 

为 false 或 true 时 ， 都 会 导致 了 矛盾 的 结果 false 一 true。 对 于 逆 命 题 ， 假 设 所 有 变量 的 逆 命 
题 都 在 另 一 个 强 连 通 分 量 中 。 由 于 有 向 图 是 对 称 的 ， 我 们 可 以 考虑 ， 每 一 个 强 连 通 分 量 中 都 包含 着 











另 一 个 分 量 所 有 命题 的 道 命题 。 另 外 ， 同 一 个 强 连 
用 这 个 


























通 分 量 中 的 所 有 命题 必须 拥有 相同 的 布尔 值 。 利 
图 ， 只 需 把 一 个 分 量 中 所 有 不 包括 离开 弧 的 命题 赋值 为 true， 曾 


可 能 找到 一 个 使 方程 成 立 





的 赋值 。 这 个 赋值 一 定 存在 ， 因 为 分 量 组 成 的 图 是 无 环 的 。 然 后 ， 把 相对 分 量 赋值 为 false， 再 把 


这 两 个 分 量 切 开 ,重新 开始 。 





» 
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连通 分 量 排序 的 。 只 需 按照 这 个 


顺序 遍历 分 量 ， 把 每 个 没有 值 的 分 量 赋值 为 true ， 然 后 把 相对 分 量 赋值 为 falses 








e 实现 细节 
























































我 们 用 整形 数 对 命题 进行 编码 ， 如 用 +1, +++, +n 来 记录 n 个 命题 变量 ， 用 -1 …, -n 来 记录 它们 
的 闭合 题 。 一 个 语句 通过 一 个 整数 对 来 编码 ， 一 个 方程 通过 一 个 语句 的 数组 来 编码 。 每 个 命题 都 与 
等 价 有 向 图 2n 个 节点 中 的 一 个 节点 相关 。 这 些 节 点 从 0 到 2n—1 编号 ， 其 中 2i 表 示 变 量 x;,,， 而 
2i+1 表示 X, 。 相 关 代码 如 下 。 
def vertex(lit): # 用 顶点 表示 给 定 命题 

工业 lie > 0; 

return 2 * (lit - 1) 
else: 


return 2 * (-lit = 1) +1 



































return affectations[::2] 


def two_sat (formula): 
# -- n 是 变量 数量 
n = max(abs(clause[p]) for p in(0, 1) for clause in formula) 
graph = [[] for node in range(2 * n)] 
for x, y in formula: x 或 y 
graph[_vertex (-x)].append(_vertex(y)) -x => y 
graph[_vertex (-y)].append(_vertex(x)) -y => x 
sccp = tarjan (graph) 
comp id = [None] * (2 * n) 分 量 的 每 个 节点 的 id 
affectations = [None] * (2 * n) 
for component in sccp: 
rep = min(component) 分 量 的 代表 点 
for vtx in component: 
comp _id[vtx] = rep 
if affectations[vtx] == None: 
affectations[vtx] = True 
affectations[vtx ^ 1] = False # Wap 
for i in range(n): 
if comp_id[2 * i] == comp_id[2 * i + 1]: 
return None # 方程 不 成 立 
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许多 经 典 问 题 都 与 图 中 的 环 相关 ， 比 如 地 理 移动 问题 或 一 个 依赖 图 中 的 异常 问题 。 最 简单 的 问 

题 是 确定 环 的 存在 性 、 负 权重 环 的 存在 性 ， 以 及 总 权重 最 小 的 环 或 平均 权重 最 小 的 环 的 存在 性 。 

其 他 问题 由 在 遍历 整个 图 ， 计 算 仅 经 过 每 条 边 一 次 的 路 径 ( 欧 拉 路 径 )， 或 者 当 不 可 能 实现 该 
十 

















目标 时 ， 计 算 至 少 经 过 每 条 边 一 次 的 路 径 〈 中国 邮差 问题 )。 这 些 问 题 都 有 多 项 式 时 间 复 杂 度 ， 
为 确定 一 个 能 准确 通过 所 有 顶点 一 次 的 环 ( 哈密 顿 环 ) 是 NP 复杂 问题 。 














搜索 环 的 算法 
OV |+|£]) 深度 优先 遍历 











总 权重 最 小 的 环 OV |-|E)) Bellman-Ford 算法 ( 最 短路 径 算法 
平均 权重 最 小 的 环 oY |-| E |) Karp 算法 
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最 优 比率 环 OUF| :| 已 |log2 0 
欧 拉 路 径 oV I+ ED 
中 国 邮差 环 ONV ED 
旅行 商 问题 OV | 2") 动态 规划 
































7.1 欧 拉 路 径 


输入 输出 
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e 应 用 
你 在 加 里 宁 格 勒 ( 旧称 柯 尼 斯 堡 ) 旅游 ， 能 否 找 到 一 条 游览 路 径 ， 要 求 仅 通过 城中 所 有 桥 一 
次 ， 而 且 还 能 回 到 出 发 点 ? 这 就 是 欧 拉 在 1736 年 研究 的 问题 情景 "。 


















































e 定义 
给 定 一 个 连通 图 G(V, E)， 图 的 每 个 顶点 都 是 偶数 价 的 “。 我 们 要 在 图 中 找到 精确 经 过 每 条 边 一 
次 的 环 。 有 向 图 和 强 连通 分 量 也 有 同样 的 问题 ， 这 时 会 要 求 离开 顶点 的 价 与 进入 顶点 的 价 一 致 。 


° 线性 时 间 复 杂 度 的 算法 

当 且 仅 当 一 个 图 的 所 有 项 点 都 是 偶数 价 的 时 候 ， 它 才 包 含 欧 拉 路 径 。 这 一 点 已 在 1736 年 被 欧 
拉 证 明 。 同 样 ， 对 于 一 个 有 向 图 ， 当 且 仅 当 它 是 连通 图 ， 且 其 所 有 顶点 的 离开 价 等 于 进入 价 时 ， 它 
才 包 含 欧 拉 路 径 。 怎 样 才能 找到 这 样 一 个 环 ” 1873 年 ，Hierholzer 提出 了 以 下 算法 。 随 意 找 一 个 顶 
点 v， 从 vv 出 发 把 所 有 经 过 的 边 都 标记 为 不 可 通过 。 边 的 选择 也 可 以 是 随机 的 。 这 样 走 一 定 能 返回 
顶点 v， 因 为 路 线 末 端 只 能 是 仅 有 奇数 条 可 通过 边 的 邻接 项 点 。 如 此 得 到 的 环 C 仅 覆 盖 一 部 分 图 。 
在 这 种 情况 下 ， 由 于 图 是 连通 的 ， 因 而 一 定 存 在 一 个 项 点 veC ， 它 有 可 通过 的 边 。 我 们 从 v 开始 
新 路 程 ， 再 次 得 到 新 的 环 C。 不 断 重 复 上 述 过 程 ， 直 至 找到 唯一 一 条 欧 拉 路 径 。 

为 了 让 算法 拥有 线性 时 间 复 杂 度 ， 对 顶点 的 搜索 一 定 要 足够 高 效 。 因 此 ， 我 们 把 环 C 切 成 P 和 
Q 两 部 分 。P 中 的 顶点 没有 邻接 的 可 通过 边 。 只 要 Q 非 空 ， 我 们 把 Q 开端 的 顶点 "删除 并 加 入 了 的 
尾部 一 一 就 像 环 在 向 前 深 动 一 样 。 然 后 ， 我 们 试 着 在 这 个 插入 顶点 v 的 地 方 加 入 一 个 通过 v 的 环 。 
为 此 ， 当 v 有 一 条 邻接 可 通过 边 时 ,我们 仪 需 遍历 、 寻 找 一 个 从 v 出 发 且 回 到 vy 的 环 R 即 可 。 接 下 
来 ,我 们 把 环 R 加 入 Q 的 开端 。 由 于 每 条 边 仅 被 考虑 一 次 ， 于 是 算法 有 了 线性 时 间 复 杂 度 。 


































































































e 实现 细节 

我 们 从 有 向 图 的 算法 实现 开始 。 为 了 简化 数据 控制 ， 我 们 使 用 以 数组 编码 的 栈 来 代表 P、Q、 
R。 当 前 队列 由 栈 P 表 示 ， 其 后 是 R， 再 后 是 Q 的 镜像 数组 。 为 了 快速 找到 一 条 离开 某 一 顶点 的 可 
通过 边 ， 我 们 在 计数 器 next[node] 中 保存 离开 顶点 node 和 已 经 过 的 弧 的 数量 。 当 我 们 通过 弧 达 到 
node 的 第 i 个 邻 点 ， 且 i= next[node] 时 ， 只 需 增 加 这 个 计数 器 的 值 。 















































def eulerian tour _directed(graph) : 
P 
Q 
R 
next = [0] * len (graph) 
while Q: 
node = Q.pop() 


tow oll 
fo} 














中 ”加 里 宁 格 勒 是 一 座 俄罗斯 城市 ， 与 波兰 和 立陶宛 接壤 ， 是 俄罗斯 的 一 块 飞 地 。 城 中 有 七 座 桥 将 普 列 
苞 利 亚 河中 两 个 岛 ， 以 及 岛 与 河岸 连接 起 来 ， 因 此 这 个 问题 也 称 作 “ 欧 拉 七 桥 ” 问 题 ， 黄 定 了 现代 
图 论 和 拓扑 学 的 基础 。 译 者 注 

D 连接 顶点 的 边 或 弧 的 数量 是 偶数 。 








译 者 注 
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P.append (node) 

while next[node] < len(graph[node]): 
neighbor = graph[node] [next[node] ] 
next[node] += 1 
R.append (neighbor) 
node = neighbor 

while R: 
Q.append(R.pop () ) 

return P 


该 算法 的 无 向 图 变种 颇 为 巧妙 。 一 旦 弧 (u, v) 被 通过 ， 需要 把 弧 v, w) 标注 为 不 可 通过 。 我 们 在 
数组 seen[v] 中 保存 v 的 相 邻 顶点 u 的 集合 ， 使 得 弧 (v, u) 不 可 被 通过 。 为 了 提 py v 在 通过 弧 
(u, v) 的 时 候 不 会 被 加 入 seen[u]， 因 为 此 时 计数 器 next[u] 已 经 增加 ， 这 条 弧 不 会 再 被 考虑 了 。 




















def eulerian tour undirected (graph) : 
| 
Q = [0] 
R=] 
next = [0] * len(graph) 
seen = [set() for _ in graph] 
while Q: 
node = Q.pop() 
P.append (node) 
while next[node] < len(graph[node]): 
neighbor = graph[node] [next[node] ] 
next[node] += 1 
if neighbor not in seen[node]: 
seen [neighbor] .add (node) 
R.append (neighbor) 
node = neighbor 
while R: 
Q.append(R.pop () ) 
return P 








© 欧 拉 路 径 的 变种 

如 果 一 个 图 是 连通 图 ， 而 且 所 有 项 点 的 价 都 是 偶数 一 一 除了 两 个 顶点 上 和 vw 的 价 是 奇数 ， 那 么 
存在 一 条 路 径 仅 一 次 通过 所 有 的 边 。 这 条 路 径 从 开始 到 v 结束 。 只 需 从 ww 开始 走 ， 通 过 上 述 算法 
就 能 找到 这 条 路 径 。 为 了 证 明 这 一 点 ， 只 需 临 时 添加 边 (u,v)， 并 寻找 一 个 欧 拉 环 即 可 。 





























7.2 中国 邮差 问题 


e 应 用 
1962 年 ， 中 国 数 学 家 管 梅 谷 做 起 了 邮递 员工 作 。 他 提出 了 在 图 中 找到 至 少 遍 历 每 条 边 一 次 且 总 
距离 最 短 的 路 径 问 题 。 这 正 是 在 城市 各 街道 间 分 发 邮件 的 邮递 员 必 须 解决 的 问题 。 
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e 定义 
指定 一 个 无 向 连通 图 G(V, E)。 我 们 的 最 终 目的 是 在 这 张 图 中 找到 一 条 能 够 至 少 经 过 每 条 边 一 
次 的 环 。 当 所 有 顶点 的 价 都 是 偶数 时 ， 解 决 方法 是 找到 一 条 欧 拉 路 径 ， 上 一 节 中 已 经 介绍 过 解法 。 
SAE: O(n?) ( 见 参考 文献 [5] )。 
e 算法 
算法 的 核心 在 于 处 理 一 张 伪 图 ， 即 一 个 允许 两 个 相同 顶点 间 有 多 条 边 的 图 。 思 路 是 添加 边 ， 使 
图 欧 拉 化 ， 并 形成 一 条 欧 拉 环 路 。 新 增 的 边 必 须 把 奇数 价 的 顶点 连接 起 来 ， 使 图 欧 拉 化 。 我 们 希望 
尽 可 能 少 地 添加 边 。 这 些 额 外 添加 的 边 会 形成 一 个 路 径 集 合 ， 使 得 奇数 价 顶点 变 成 偶数 价 顶点 。 
因此 ， 问 题 的 核心 就 变 成 在 一 个 完整 的 图 中 ， 使 用 所 有 奇数 价 顶 点 集合 V 计算 一 个 完美 分 割 ， 
使 得 在 图 G 中 ， 一 条 边 (u, v) 的 权重 等 于 wx Fl 之 间 的 距离 。 
使 用 Floyd-Warshall 算法 计算 所 有 距离 需要 O(n?) 复杂 度 。 此 外 ， 以 Gabow 算法 计算 最 小 权重 
的 完美 分 割 可 以 在 时 间 O(n) 内 完成 ( 见 参 考 文 献 [9] )， 但 对 本 书 寻 求 高 效 算 法 的 主旨 而 言 ， 该 算 
法 过 于 复杂 了 。 



























































7.3 ”最 小 长 度 上 的 比率 权重 环 : Karp 算法 

一 个 经 上 典 问题 是 在 一 个 图 中 找到 负 环 。 一 个 应 用 将 在 后 面 章节 中 作为 练习 给 出 。 给 定 n 种 货币 
及 其 竟 换 汇率 ， 如 何 通 过 交易 货币 来 挣 钱 ?” 在 本 节 中 ， 我 们 只 讨论 一 个 解法 更 优雅 的 问题 。 
。 定义 


给 定 一 个 有 权重 的 有 向 图 ， 目 的 是 找到 一 个 环 C， 使 得 环 经 过 的 缴 的 权重 平均 信守 





























最 小 。 


e 应 用 

假设 用 一 个 图 的 项 点 和 弧 分 别 给 一 个 系统 的 状态 和 变化 建 模 ， 每 个 变化 (一 条 弧 ) 都 用 所 需 消 
耗 的 资源 量 来 标注 权重 。 在 每 个 时 间 节 点 上 ， 系 统 都 处 于 一 个 特殊 状态 ， 而 且 要 通过 离开 弧 来 进化 
到 下 一 个 状态 。 我 们 的 目的 是 让 长 期 资源 消耗 最 小 化 ， 而 最 优 方案 是 一 个 最 小 平均 权重 环 。 


e SHEA OM -IEl) 的 Karp 算法 ( 见 参考 文献 [16] ) 

算法 假设 存在 一 个 从 任意 顶点 都 能 到 达 的 源 点 。 必 要 时 ， 可 以 添加 这 样 一 个 顶点 到 图 中 。 
由 于 问题 焦点 是 环 中 弧 的 平均 权重 , 因而 环 本 身 的 长 度 也 同样 重要 “。 因 此 , 相对 于 简单 计算 出 
最 短路 径 的 方案 ， 我 们 更 希望 能 针对 每 个 顶点 v 和 每 条 弧 长 1= 0,…, n， 确 定 一 条 从 源 点 到 v 的 最 短 


















































© 平均 权重 是 用 权重 总 和 除 以 弧 的 数量 。 在 权重 相等 的 情况 下 ， 弧 的 数量 增多 则 平均 值 降低 。 
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路 径 ， 该 路 径 准 确 地 由 1 条 弧 组 成 。 这 部 分 可 通过 动态 规划 来 实现 。 以 d[7][v] 来 表示 这 条 最 短路 径 














后 ， 该 值 对 于 每 个 1= 1,…,n A: 
d[l[v]= min d[/ -1][u]+w, 





uv 














其 中 , HAIR (u, v) 的 权重 w,, 最 小 时 , 等 式 能 得 到 最 小 值 "。 我 们 用 d[v] = min,_ d[A][v] 来 
记录 从 源 点 到 v 的 距离 。 
e 关键 测试 

对 于 一 个 最 小 平均 权重 环 C， 其 权重 4 如 下 2 : 

A=min max = (7.1) 
v k=0,---, n-1 n-k 

为 了 证 明 这 一 点 ， 只 需 从 4 =0 开始 一 系列 测试 。 我 们 必须 证 明 以 上 公式 的 右边 等 于 0， 这 相 

当 于 证 明 : 








min max d[n][v] —d[k][v]=0 


由 于 4=0 ,图 中 不 包含 负 权 重 的 环 。 对 于 所 有 顶点 v， 一定 存在 一 条 从 源 点 到 顶点 v 的 非 环 最 
短路 径 ， 即 © 





d{v] max 7 d{k][v] 
因此 ® 
„max d[n][v]—d[v]=d[n][v]— dy] 


对 于 所 有 满足 din div] 的 顶点 v, 有 
min d[n][v]-d[v]=0 

















剩 下 要 做 的 只 是 证 明 对 于 一 个 项 点 vv， 有 等 式 d[m][y] = dty]。 设 一 个 环 C 的 项 点 u， 由 于 不 存在 
负 环 ， 因 而 一 定 存 在 一 条 从 源 点 到 4 的 权重 最 小 的 简单 路 径 P。 我 们 把 环 C 的 复 本 补 全 到 了 P， 得 到 一 





利用 动态 规划 的 思想 ， 把 解 d[/][v] 拆 分 成 d[1-1][u] 的 最 小 权重 和 缴 (u, v) 的 权重 。 一 一 译 者 注 

在 最 小 平均 权重 环 C 的 权重 公式 中 , vy 是 一 个 从 所 有 项 点 都 能 到 达 的 顶点 。 从 某 个 顶点 开始 经 过 n 

条 绝 的 距离 减 去 经 过 上 条 弧 的 距离 ， 除 以 n fk HA, 就 是 n 入 间 的 平均 距离 ， 变 动 Yv、n、k， 找 

到 一 个 总 体 平均 值 最 小 的 4 就 是 最 小 平均 权重 环 的 权重 。 一 一 译 者 注 

源 点 到 v 的 最 短路 径 是 经 过 0 AMS] n-1 条 约 的 所 有 路 径 中 最 短 的 一 条 。 译 者 注 

公式 右边 的 dfn][v] 是 从 v 出 发 经 过 nn 条 弧 的 路 径 长 度 ， 减 去 从 源 点 到 vv 的 距离 ， 该 值 一 定 是 所 有 路 

径 中 最 长 的 一 条 ， 也 就 是 说 ， 走 了 最 多 nn 条 弯路 的 路 径 。 译 者 注 

© RHE, Av 出 发 的 路 径 中 ,最短 的 一 条 是 返回 其 本 身 的 情况 ， 即 n = 0。 其 他 情况 只 要 经 过 任意 
一 个 孤 都 会 超过 它 的 长 度 ， 因 此 ， 经 过 任意 多 条 绝 的 路 径 最 小 值 减 去 v 到 源 点 的 距离 仍 大 于 等 于 0。 

译 者 注 


© © 
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条 路 径 P'， 该 路 径 从 源 点 到 且 长 度 至 少 为 mn。 由 于 C 的 权重 为 空 4 4=0 )，P' 仍 是 通 向 zx 的 最 小 
权重 的 路 径 。 设 P" OY PTE, 长度 是 n;v 是 P" 的 最 后 一 个 顶点 ，P” 也 是 从 源 点 到 达 v 的 最 短 
路 径 (图 7.1)。 因 此 ， 对 于 这 个 顶点 有 d[n][v]= d[v]， 这 就 证 明了 在 4=0 的 情况 下 ， 等 式 成 立 。 














OQ 
©) 


图 7.1 对 4=0 情况 的 证 明 。P 是 从 源 点 s 到 zx 的 最 小 权重 路 径 。 添 加 一 个 权重 为 
0 的 环 C， 使 得 路 径 仍 是 最 小 权重 路 径 ， 因 此 ， 在 环 中 遇 到 的 所 有 顶点 即 在 
最 小 权重 路 径 中 经 过 的 顶点 





对 于 4 关 0 的 情况 ,我 们 来 做 一 个 有 趣 的 测试 。 如 果 从 每 个 弧 的 权重 中 去 掉 一 个 值 A ， 的 值 
也 只 会 减少 和 A 。 如 果 用 中 来 记录 网 中 被 改动 过 的 距离 ， 会 得 到 下 列 等 式 : 
d'In]iv]-d'Ik]iv] _ dinllv]-rA -(d'Ik][v]-kA) 
n-k n-k 
_ d{n]iv]d[k][v] nA-kA) 
2 n-k n-k 
_ ania) _ 
n-k 
这 证 明了 等 式 (7.1) 的 右边 同样 会 减少 A 。 为 A 选 择 常 数 4 ， 最 终 同样 会 得 到 4 =0 的 情况 ， 这 
就 证 明了 等 式 (7.1). 
e 实现 细节 
SARE dist 保存 着 上 述 距离 列表 。 除 了 这 个 和 矩阵， 还 需要 一 个 变量 prec 来 表示 一 条 最 短路 径 









































A 





的 前 驱 顶 点 。 在 填充 好 这 些 和 矩阵 后 ， 我 们 需要 找到 顶点 对 (v, A 来 优化 表达 式 (7.1)， 然 后 提取 出 环 。 
假如 从 源 点 出 发 找 不 到 任何 环 ， 函 数 返 回 None 值 。 





def min_mean_cycle(graph, weight, start=0): 
INF = float('inf') 


n = len(graph) # 计算 距离 
dist = [[INF] * n] 
prec = [[None] * n] 
dist[0] [start] = 0 


for ell in range(1, n + 1): 
dist.append([INF] * n) 
prec.append([None] * n) 
for node in range (n): 

for neighbor in graph[node]: 














DQ 达成 P' 要 求 的 前 一 个 步骤 需要 达成 P"， 即 动态 规划 中 的 问题 分 解 思路 。 
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alt = dist[ell - 1] [node] + weight [node] [neighbor] 
if alt < dist[ell] [neighbor]: 

















dist[ell] [neighbor] = alt 
prec[ell] [neighbor] = node 
# -- 确定 最 优 值 
valmin = INF 
argmin = None 
for node in range (n): 
valmax = -INF 
argmax = None 
for k in range(n): 
alt = (dist[n] [node] - dist[k][node]) / float(n - k) 
# 总 权重 最 小 的 环 不 除 以 float (n - k) 
if alt >= valmax: # 使 用 >=， 寻找 简单 环 

















valmax = alt 
argmax = k 
if argmax is not None and valmax < valmin: 
valmin = valmax 
argmin = (node, argmax) 
# -- 提取 环 
if valmin == INF: # -- 完全 没有 环 





return None 
C= if 
node, k = argmin 
for 1 in range(n, k, -1): 
C.append (node) 
node = prec[1] [node] 
return C[::-1], valmin 











7.4 单位 时 间 成 本 最 小 比率 环 


e 定义 





一 个 有 向 图 的 每 条 弧 上 都 有 两 个 权重 ,分 别 是 成 本 c 和 时 间 # 时 间 为 正 值 或 空 ， 而 成 本 是 








随机 的 。 算 法 的 目的 是 找到 一 个 环 ， 使 总 成 本 和 总 时 间 的 比值 最 小 ， 问 题 又 称 作 “不 定 线 货船 


问 题 ” o 


e 应 用 








一 条 商船 的 船长 希望 找到 一 条 收益 最 大 的 航海 路 线 。 他 手头 有 一 张 海 图 














， 完 整 覆 盖 了 所 有 


E 


和 每 条 港口 间 航 线 ， 每 条 弧 (u, v) 都 被 标注 了 从 出 发 到 达 v 所 需 的 时 间 ， 以 及 从 zx 采购 商品 到 ， 
销售 能 够 获得 的 利润 。 我 们 的 任务 是 找 到 一 个 环 ， 在 总 时 间 内 让 收益 达到 最 高 。 
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e 使 用 二 分 查找 的 算法 
对 于 一 个 环 C， 条 件 是 当 且 仅 当 ? 
> vc(O) <5, Eewa ， Yic(a)- dt(a)<0 . 
Da) aeC aeC aeC 
其 目标 值 至 少 是 5 。 所 以 ， 想 找到 一 个 比值 比 5 更 好 的 环 ， 只 需 在 图 中 找到 一 个 弧 的 权重 值 是 
c(a)- Sta) 的 负 环 。 这 个 测试 可 以 被 用 在 二 分 查找 中 ， 以 得 到 指定 精度 的 答案 。 当 所 有 成 本 和 时 间 
权重 值 都 是 整数 时 ， 精 度 只 需 达 到 1/ > ,tla) 就 可 以 精确 解决 这 个 问题 。 因 此 ， 算 法 的 时 间 复 杂 度 
是 O(log(907a))-V|-|4D ， 其 中 V 是 顶点 的 集合 ，A 是 弧 的 集合 。 
由 于 刚 开始 没有 最 佳 值 5 的 上 界 或 下 界 ， 我 们 从 5 =1 开 始 测试 。 当 测试 结果 为 负 值 时 ， 我 们 
就 把 5 乘 以 2， 以便 获得 正 值 结果 5' ; 当 测试 结果 为 正 值 时 ， 即 得 到 最 佳 值 的 上 、 下 界 。 当 计算 初 
始 值 是 正 值 时 ， 我 们 继续 原 有 操作 ， 但 要 除 以 2 再 继续 “。 






















































































7.5 旅行 推销 员 问 题 





















































° 定义 

给 定 一 个 图 ， 弧 上 标注 了 权重 ， 我 们 和 希望 计算 出 一 条 从 指定 点 出 发 的 最 短路 径 ， 使 路 径 能 ;从 
经 过 每 个 顶点 各 一 次 。 这 样 的 路 径 称 为 “哈密 顿 路 径 ”。 

SAE: 使 用 动态 规划 情况 下 为 O(72")。 
e 算法 

这 种 决策 问题 是 一 个 NP 完备 问题 ， 我 们 现在 介绍 一 个 当 顶 点 数 在 20 个 左右 时 的 可 接受 算法 。 
为 方便 描述 ， 假 设 顶 点 从 0 开始 编号 直到 n-1， 且 编号 n-1 的 顶点 是 源 点 。 对 于 每 个 集合 
SS{0,1,…,n 一 2} ， 我们 用 OSIM 来 记录 从 源 点 出 发 ,通过 S 中 所 有 顶点 并 终止 于 顶点 v (vgs) 
的 路 径 的 最 小 权重 。 

对 于 基本 情况 ，O[G][v] 就 是 从 编号 n-1 的 顶点 到 顶点 v 的 弧 长 。 否 则 对 于 非 空 的 S， 弧 长 为 
O[S][v]， 且 当 所 有 顶点 ueS 时 ， 它 是 公式 


O[S\{u} ][u]+w,, 
的 最 小 值 ， 其 中 w,, 是 弧 (u, v) 的 权重 。 








D 最 左边 的 算式 ,一 个 环 的 路 径 上 所 有 绝 的 成 本 之 和 除 以 经 过 所 有 弧 的 时 间 之 和 ， 可 以 理解 为 性 价 比 。 
假如 我 们 需要 让 这 个 值 最 大 ， 即 所 有 能 找到 的 环 的 单位 收益 都 小 于 等 于 这 个 值 ， 那 么 反 推 就 可 以 得 
到 使 它 成 立 的 条 件 ， 即 最 右边 的 算式 。 译 者 注 

D 二 分 查找 的 核心 是 先 指定 一 个 上 界 和 下 界 ， 然 后 把 上 、 下 界 一 分 为 二 ， 判 断 两 部 分 中 哪 一 部 分 符合 
测试 要 求 ， 然 后 把 符合 要 求 的 那 一 部 分 的 上 、 下 界 作为 新 的 上 、 下 界 继续 查找 。 一 一 译 者 注 





SSE ”最短 路径 


图 论 的 一 个 经 典 问题 是 找到 两 个 顶点 一 一 源 点 s 和 目标 顶点 v 之 间 的 最 短路 径 。 在 成 本 不 变 的 
情况 下 ， 我 们 可 以 找到 源 点 s 和 所 有 可 能 目标 顶点 v 之 间 的 最 短路 径 。 因 此 ， 在 本 章 介绍 的 算法 
中 ， 我 们 对 有 向 图 中 有 唯一 源 点 的 普 适 问题 更 感 兴趣 。 

一 条 路 径 的 长 度 被 定义 为 其 所 有 弧 的 权重 总 和 。 从 s P v 的 距离 被 定义 为 和 v 之 间 最 短路 径 
长 度 。 为 方便 表述 ， 我 们 仅 简单 展示 如 何 计算 距离 。 为 了 获得 一 条 满足 要 求 的 路 径 ， 在 距离 数组 之 
外 ， 只 需 维护 一 个 前 驱 顶 点 数组 。 因 此 ， 对 于 一 个 顶点 w， 如 果 dist[v] 是 从 s 到 v 的 距离 且 dist[v] = 
dist[u] + w[uJ[v]， 那 么 在 前 驱 顶 点 数组 中 保存 prec[v] = wu。 从 前 驱 顶 点 回溯 到 源 点 *， 我 们 就 可 以 用 
逆序 法 确定 一 条 从 源 点 到 指定 目标 顶点 的 最 短路 径 。 






























































8.1 组合 的 属性 


最 短路 径 拥 有 组 合 属性 ， 这 是 寻找 最 短路 径 的 不 同 算法 之 间 的 关键 差异 。Bellman 称 之 为 “最 
优化 原则 ”， 这 也 是 动态 规划 问题 的 核心 。 让 我 们 考虑 一 条 从 s 到 v 的 路 径 P (也 称 s-v PRE), € 
经 过 一 个 顶点 u (图 8.1 )。 因 此 ， 这 是 一 条 从 到 z 的 路 径 P 和 一 条 从 xz 到 v 的 路 径 P, 的 拼接 。P 
的 长 度 是 P M P, 的 长 度 和 。 所 以 ， 如 果 P 是 从 s E) v 的 最 短路 径 ， 那 么 P| 必定 是 从 s 到 w 的 最 短 
路 径 ， 而 且 P, 也 必定 是 从 xz 到 vw 的 最 短路 径 。 这 个 结论 的 证 明 很 简单 ， 假 如 我 们 能 用 一 条 更 短 的 
EKR H P|， 那 一 定 会 得 到 一 条 比 P 更 短 的 路 径 。 

8.1 从 出发、 经 过 zx F) v 的 最 短路 径 ， 是 由 从 s E u 的 最 短路 
径 和 从 uw F) v 的 最 短路 径 组 成 的 
































e ZE., AE, REMA 
组 合 属性 是 Dijkstra 算法 及 其 变种 的 基础 ， 用 于 弧 上 包含 正 值 和 空 值 权重 的 图 。 算 法 维护 数组 
dist 来 保存 从 源 点 s 到 目标 项 点 v 的 距离 ;对 于 没有 找到 任何 s-v 路 径 的 目标 项 点 v, 保存 + ce。 因 


















































此 ， 图 的 顶点 被 分 成 三 组 (图 8.2 )。 黑 色 顶 点 是 从 源 点 出 发 的 已 知 最 短路 径 顶 点 ， 灰 色 顶 点 是 黑色 
顶点 的 直接 相 邻 顶点， 白色 顶点 是 还 没有 找到 任何 路 径 的 顶点。 

刚 开 始 ， 只 有 源 点 s 是 黑色 的 ， 其 dist[s]=0。s 的 直接 相 邻 顶点 都 是 灰色 的 ，dist[v] 是 弧 (s, v) 
的 权重 。 其 他 顶点 都 是 白色 的 。 然 后 ， 算 法 循环 标注 一 个 顶点 的 颜色 为 黑色 或 灰色 ， 并 把 其 相 邻 白 
色 顶 点 标注 为 灰色 ， 其 他 维持 不 变 。 最 终 ， 所 有 从 源 点 可 到 达 的 顶点 都 会 被 标注 为 黑色 ， 而 其 他 顶 
点 会 是 白色 。 











图 8.2 使 用 Dijkstra 算法 标注 顶点 颜色 。 每 个 顶点" 都 以 从 源 点 到 
其 之 间 的 距离 dist] 来 标注 ， 用 prec 表示 的 弧 以 粗 体 显示 


e 关键 测试 

哪个 灰色 顶点 会 被 选中 并 标注 为 黑色 ? ARES dist[y] 最 小 的 灰色 顶点 。 为 什么 这 一 选择 能 奏 
效 呢 ?让 我 们 考虑 一 个 随机 的 s-v 路 径 P。 由 于 是 黑色 的 而 是 灰色 的 ， 因 而 在 这 条 路 径 上 一 定 
存在 一 个 顶点 二 是 灰色 的 。 所 以 ，P 可 以 拆 分 为 一 条 s-u 路 径 P, 和 一 条 u-v 路径 P,; 其 中 P| 仅 包含 
黑色 的 中 间 顶 点 ， 除 了 us 通过 选择 v， 且 dist[u] > dist[v]， 并 假设 所 有 弧 的 权重 都 是 正 值 或 空 值 ， 
IBA P, 的 长 度 就 是 正 值 或 空 值 。 所 以 , P 的 长 度 一 定 至 少 是 dist[v]。 由 于 这 个 P 是 随机 选择 的 ， 这 
就 证 明了 最 短路 径 s-v 的 长 度 是 dist[v]。 因 此 ， 把 v 标注 为 黑色 是 有 效 的 。 为 了 维护 状态 不 变 的 顶 















































点 ， 必 须 保 证 能 从 v 出 发 并 经 过 一 条 弧 抵 达 每 个 顶点 v'; 当 v' 不 是 灰色 时 ， 把 v' 标 注 为 灰色 ， 而 
dist[v]+w[v][v'] 是 找到 dist[v1] 的 一 个 新 候选 方案 。 


最 短路 径 算法 
没有 权重 “ 度 优先 遍历 ( BFS) 
权重 为 0 或 1 使 用 双向 队列 的 的 Dijkstra 算法 


























权重 为 正 值 或 空 值 Dijkstra 算法 
随机 权重 。 Bellman-Ford 算法 
所 有 源 点 Floyd-Warshall 算法 
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e 灰色 顶点 的 数据 结构 

在 每 次 遍历 过 程 中 ， 我 们 都 要 寻找 一 个 灰色 顶点 v 使 得 dist[v] 最 小 ， 所 以 使 用 一 个 优先 级 序列 
来 存储 顶点 v 的 候选 者 是 合理 的 ，dist 的 值 成 了 优先 级 的 值 。 这 就 是 Dijkstra 算法 选择 的 实现 方式 。 
因此 ， 用 最 短 距 离 来 选择 顶点 可 以 在 顶点 数量 的 对 数 时 间 内 完成 。 

如 果 图 比较 简单 ， 我 们 可 以 用 一 个 更 简单 的 数据 结构 。 比 如 ， 当 所 有 弧 的 权重 都 在 集合 {0, 1} 
中 时 ， 只 可 能 存在 两 种 类 型 的 灰色 顶点， 即 距离 为 4 的 项 点 和 距离 为 d+1 的 顶点 。 因 此 ， 优 先 级 队 
列 可 以 采用 更 简单 的 双向 队列 来 实现 。 队 列 包含 了 用 优先 级 排序 的 灰色 顶点 列表 ， 只 需 在 常数 时 间 
内 从 队列 左 侧 抽取 一 个 顶点 并 标注 为 黑色 。yv 的 相 邻 顶点 将 根据 其 相关 弧 的 权重 是 0 还 是 1 被 添 
加 到 队列 的 左 侧 或 右 侧 (图 8.2). 最终 ， 所 有 队列 的 操作 时 间 都 是 常数 时 间 ， 相 对 于 Dijkstra 算法 ， 
这 能 节省 一 个 对 数 因子 的 时 间 。 

如 果 图 还 要 更 加 人 简单， 即 所 有 弧 的 权重 都 相同 一 一 在 某 种 程度 上 这 就 是 无 权重 图 ， 那 么 双向 队 
列 可 以 被 简单 队列 来 蔡 换 。 请 参阅 6.5 节 介 绍 的 广度 优先 算法 。 























82 ”权重 为 0 或 1 的 图 


e 定义 
给 定 一 个 图 ， 其 所 有 弧 的 权重 都 是 0 或 1， 同 时 给 定 一 个 源 点 s， 和 希望 计算 s 到 其 他 顶点 的 
距离 。 


e 应 用 

假设 有 一 张 N x M 的 矩形 迷宫 地 图 ， 迷 富里 有 障碍 物 。 你 希望 在 拆 掉 尽 可 能 少 的 墙 的 情况 下 ， 
找到 走出 迷宫 的 方法 。 这 个 迷宫 可 以 被 视 为 一 个 有 向 图 ， 从 一 个 格子 到 相 邻 格子 的 弧 的 权重 要 么 是 
0 ( 通 向 一 个 空格 )， 要么 是 1 ( 通 向 一 个 有 障碍 物 的 格子 )。 现 在 要 尽 可 能 少 拆 墙 ， 找 到 从 起 点 到 出 
口 的 最 短路 径 。 






































。 算法 
我 们 使 用 最 短路 径 算法 的 通用 结构 。 在 任何 情况 下 ， 图 中 所 有 顶点 都 被 分 成 三 组 : 黑色 、 灰 色 
和 上 白色。 


算法 维护 一 个 双向 队列 ， 队 列 保存 所 有 灰色 顶点 以 及 在 插入 时 是 灰色 但 会 变 成 黑色 的 顶点 。 队 
列 优先 级 的 值 是 x， 所 有 黑色 顶点 v 满 足 dist[v] = x。 直 到 某 个 特定 位 置 ， 所 有 灰色 顶点 v 满足 
dist[v]=x， 而 后 续 顶 点 满足 dist[v] = x+l。 

一 旦 这 个 队列 非 空 ， 算 法 从 队列 头 部 提取 顶点 v， 其 值 dist[v] 一 定 是 最 小 的 。 如 果 这 个 顶点 已 
经 是 黑色 的 ， 就 不 需要 任何 操作 ; 否则， 该 顶点 被 标注 为 黑色 。 从 现在 开始 ， 为 了 维护 那些 不 变 的 
顶点 ， 需 要 把 的 某 个 相 邻 顶点 交加 入 队列 。 对 于 7 = dist[v]+w[v]j[v]， 如 果 v' 已 经 是 黑色 或 者 
dist[v1] <7, 不必 把 v' 加 入 队列 ; 否则 v' 被 标注 为 灰色 ，dist[v1] 减 小 1， 是 在 whi] = 0 的 情况 下 ， 






































区 被 加 入 到 队列 头 部 ， 或 在 w[v][v] = 1 的 情况 下 ， 被 加 入 队列 尾部 。 





def qist01 (graph, weight, source=0, target=None): 
n = len(graph) 


dist = [float('inf')] * n 
prec = [None] * n 
black = [False] * n 
dist[source] = 0 
gray = deque([source]) 
while gray: 
node = gray.pop() 
black[node] = True 
if node == target: 
break 


for neighbor in graph[node]: 
ell = dist[node] + weight [node] [neighbor] 
if black[neighbor] or dist[neighbor] <= ell: 
continue 
dist[neighbor] = ell 


prec[neighbor] = node 
if weight [node] [neighbor] == 0: 
gray.append (neighbor) 


else: 
gray.appendleft (neighbor) 
return dist, prec 











8.3 ”权重 为 正 值 或 空 值 的 图 : Dijkstra 算法 


e 定义 








给 定 一 个 有 向 图 ， 其 所 有 弧 的 权重 都 是 正 值 或 空 值 ， 我 们 在 一 个 源 点 和 一 个 目标 节点 之 间 寻 找 











最 短路 径 。 


° 复杂 度 


一 个 暴力 实现 的 复杂 度 是 O(7 门 ， 用 一 个 优先 级 队列 优化 后 ， 可 以 让 复杂 度 降 低 到 
O(Ellog| 由 。 通 过 斐 波 那 契 优 先 级 队列 ， 我 们 能 获得 更 低 的 复杂 度 O(EHPlogl 太 ， 但 为 了 实现 优化 





而 付出 的 努力 过 大 ， 有 点 得 不 偿 失 。 
。 算法 








我 们 仍 采用 本 书 8.1 节 的 形式 。Dijkstra 算法 维护 了 一 个 顶点 集合 S$， 我 们 已 经 计算 好 了 从 源 点 
到 这 些 顶 点 的 最 短路 径 ， 所 以 S 一 定 是 黑色 顶点 的 集合 。 刚 开始 ，S 只 包含 源 点 本 身 。 另 外 ， 算 法 











维护 一 个 以 源 点 为 根 的 最 短路 径 树 来 覆盖 S。 我 们 用 prec[v] 来 记录 v 的 前 驱 顶 点 ， 











j dist[v] 来 记录 





计算 所 得 的 距离 (图 8.3 )。 
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图 8.3 Dijkstra 算法 用 一 个 以 项 点 为 圆心 逐渐 扩大 的 同心 圆 来 捕捉 顶点 。 由 于 没有 距 
离 为 1 的 顶点 ， 因 而 算法 通过 优先 级 队列 ， 直 接 跳 到 最 近 的 距离 为 2 的 顶点 


然后 来 看 S 边缘 的 边 。 更 准确 地 说 ， 我 们 考虑 弧 (u, v)， 其 中 在 S 内 而 v 不 在 S 内 。 这 些 弧 


优先 级 。 如 8.1 节 的 解释 ,算法 从 优先 级 队列 中 抽取 一 个 优先 级 最 小 的 弧 (u, v) 来 定义 最 短路 径 s-v， 
然后 把 弧 (u, v) 添加 到 最 短路 径 树 中 ， 把 v 添 加 入 S 中 ， 并 继续 迭代 。 


© 优先 级 队列 

算法 的 核心 内 容 是 优先 级 队列 。 这 是 一 个 能 添加 元 素 并 抽取 最 小 元 素 的 元 素 集合 而 成 的 数据 
结构 。 这 种 结构 通常 使 用 堆 来 实现 ( 即 最 小 堆 ， 见 1.5.4 节 )， 此 处 的 运算 成 本 是 与 集合 大 小 相关 的 
对 数 。 
© 小 优化 

为 了 更 高 效 ， 不 要 在 优先 级 队列 中 保存 那些 不 能 引 向 最 短路 径 的 弧 。 为 此 ， 我 们 在 每 次 向 队列 
中 添加 通 向 v 的 弧 时 ， 应 当 更 新 dist[v]。 因 此 在 检查 一 条 弧 时 ， 我 们 就 能 确定 是 否 有 一 个 弧 优 于 现 
有 通 疝 v 的 最 优 路 径 。 


e 实现 细节 

以 下 代码 能 计算 出 通 向 所 有 目标 的 最 短路 径 ， 而 且 省 略 了 在 调用 函数 时 指定 某 一 特定 目标 参数 
的 步骤 。 

在 队列 中 ， 我 们 为 每 条 离开 弧 (zw v) 保存 数据 对 (d, v), HEF d 是 与 弧 相 关 的 路 径 长 度 。 





































































































一 个 顶点 可 能 在 队列 中 以 不 同 权 重出 现 多 次 。 但 是 ,一 旦 该 顶点 第 一 次 被 抽取 出 来 ， 就 会 被 标 
注 为 黑色 ， 而 该 顶点 的 其 他 相关 记录 会 在 抽取 时 被 忽略 。 





from heapgq import heappop, heappush 


def dijkstra(graph, weight, source=0, target=None): 
n = len(graph) 
assert all(weight[u][v] >= 0 for u in range(n) for v in graph[u]) 
prec = [None] * n 
black = [False] * n 
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dist = [float('inf')] * n 
dist[source] = 0 
heap = [(0, source) ] 
while heap: 
dist node, node = heappop (heap) # 最 近 的 顶点 
if not black[node]: 
black[node] = True 
if node == target: 
break 


for neighbor in graph[node]: 
dist neighbor = dist node + weight [node] [neighbor] 
if dist neighbor < dist[neighbor]: 
dist[neighbor] = dist_neighbor 
prec[neighbor] = node 
heappush(heap, (dist neighbor, neighbor) ) 
return dist, prec 











o 变种 

如 果 我 们 有 一 个 能 改变 元 素 优先 级 的 优先 级 队列 ， 正 如 1.5.4 节 中 介绍 的 那样 ， 那 么 Dijkstra 算 
法 的 实现 就 可 以 略微 简化 。 我 们 不 再 把 弧 存 人 队列 ， 而 只 保存 项 点 一 一 实际 上 是 图 中 所 有 顶点 ,并 
且 一 个 顶点 y 的 优先 级 就 是 dist[v]。 其 实 ， 队 列 保存 了 格式 为 (dist[v], v) 的 数据 对 ， 并 用 字典 序 比 
较 它 们 。 当 发 现 一 条 通 向 v 的 更 好 路 径 时 ， 我 们 把 与 相关 的 数据 对 替换 为 一 个 更 短 的 路 径 长 度 。 
变种 的 好 处 在 于 ， 我 们 不 必 再 将 顶点 标注 为 黑色 。 对 于 每 个 顶点 v， 队 列 仅 包 含 一 个 与 v 相关 的 数 
据 对 。 当 (dist[v], v) 从 队列 中 被 抽取 时 ， 我 们 就 知道 找到 了 通 向 v 的 最 短路 径 。 
































from tryalgo.our heap import OurHeap 


def dijkstra update heap (graph, weight, source=0, target=None): 
n = len(graph) 
assert all(weight[u][v] >= 0 for u in range(n) for v in graph[u]) 


prec = [None] * n 
dist = [float('inf')] * n 
dist[source] = 0 
heap = OurHeap([(dist[node], node) for node in range(n) ]) 
while heap: 
dist node, node = heap.pop() # 最 近 的 顶点 
if node == target: 
break 


for neighbor in graph[node]: 

old = dist[neighbor] 

new = dist node + weight [node] [neighbor] 

if new < old: 
dist[neighbor] = new 
prec[neighbor] = node 
heap.update((old, neighbor), (new, neighbor) ) 

return dist, prec 
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8.4 随机 权重 的 图 : Bellman-Ford 算法 








e 定义 
这 个 问题 允许 图 中 弧 上 的 权重 为 负 值 。 假 如 存在 一 个 从 源 点 出 发 并 能 通过 目标 顶点 的 负 权重 
HK, 那么 源 点 到 目标 项 点 的 距离 为 -co。 当 任意 多 次 通过 这 个 环 时 ， 我 们 反而 会 得 到 一 条 从 源 点 出 





发 的 距离 极 小 的 路 径 了。 下 面 介绍 的 算法 能 发 现 这 一 异常 状况 。 

SARE: 使 用 动态 规划 情况 下 是 OV ED 
。 算法 

核心 操作 是 释放 距离 ( 图 8.4 )， 即 对 于 每 条 弧 (u, v)， 测 试用 该 弧 能 否 减 少 从 源 点 到 顶点 v 的 
IEB diwn EEAS d, 的 一 个 候选 值 。 这 一 操作 通过 两 个 咎 套 循 环 来 完成 ， 内 层 循环 释放 了 通过 每 
































条 弧 到 达 顶 点 的 距离 ; 外 层 循 环 该 操作 ， 并 执行 一 定 次 数 。 我 们 可 以 证 明 ， 在 次 外 层 迭 代 后 ， 能 
为 每 个 顶点 v 计 算出 从 源 点 到 v 且 最 多 经 过 条 弧 的 最 短路 径 。 这 个 结论 在 k=0 时 是 正确 的 。 对 大 = 

















1,…,| 四 -1 的 情况 ， 用 d[v] 来 记录 该 距离 时 ， 我 们 有 : 


d,[v]= min d,{u]+W,, 


u(u,v 





图 8.4 一 个 使 用 灰色 边 释 放 距 离 的 例子 。 用 这 条 边 让 源 点 到 目标 项 
点 的 路 径 更 短 ” 


© 负 环 检测 

首先 考虑 图 不 包含 负 环 的 情况 。 在 此 情况 下 ， 所 有 最 短路 径 都 很 简单 ， 只 需 |VI-1 次 循环 迭代 ， 
就 能 确定 所 有 通 向 目标 的 路 径 距 离 。 因 此 ， 如 果 在 | 岂 次 迭代 中 发 现 了 一 个 变化 ， 这 表明 存在 着 一 
个 负 环 ， 并 且 是 能 从 源 点 到 达 目 标的 负 环 。 实 现 会 返回 一 个 布尔 值 来 指出 是 否 存在 这 样 一 个 环 。 


























@ 因为 环 的 权重 是 负 值 ， 所 以 多 绕 几 园 反 而 让 路 径 变 短 。 译 者 注 
@ 从 源 点 0 开始， 经 过 一 条 权重 为 9 的 陶 ， 到 达 右 上 角 目 标 顶 点 ; 后 变 成 通过 右 下 角 灰 色 顶 点 ， 总 距 
BERT 6。 每 个 顶点 上 标注 的 数字 是 它 到 源 点 的 距离 。 译 者 注 
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def bellman ford(graph, weight, source=0): 
n = len(graph) 
dist = [float('inf')] * n 


prec = [None] * n 
dist[source] = 0 


for nb_iterations in range (n+2) : 
changed = False 
for node in range(n): 
for neighbor in graph[node]: 
alt = dist[node] + weight [node] [neighbor] 
if alt < dist[neighbor]: 





dist[neighbor] = alt 
prec[neighbor] = node 
changed = True 

if not changed: # 固定 点 











return dist, prec, False 
return dist, prec, True 











8.5 MEHA - 目标 顶点 对 : Floyd-Warshall 算法 


° 定义 
给 定 一 个 在 匆 上 有 权重 的 图 ， 我 们 希望 计算 每 个 顶点 对 之 间 的 最 短路 径 ( 图 8.5 )。 同 样 ， 问 题 
只 在 图 中 不 存在 负 权 重 环 的 情况 下 成 立 ， 而 算法 可 以 检测 到 这 一 异常 情况 。 
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图 8.5 Floyd-Warshall 算法 可 被 视 为 热带 代数 "下 的 和 矩阵 乘法 ( 及 , min, +). 
但 我 们 不 能 使 用 它 的 快速 乘积 算法 ， 因 为 这 里 只 有 一 个 半 环 





复杂 度 : 使 用 Floyd-Warshall 算法 ， 复 杂 度 为 Om) 
e 算法 

顶点 间 的 距离 是 以 动态 规划 来 计算 的 (图 8.6 )。 对 于 每 个 上 = 0, Lon, BET 
EW, H We Lully] 保存 从 E) v 且 仅 经 过 下 标 严 格 小 于 左 的 中 间 顶 点 的 最 短路 径 长 度 ， 这 些 中 间 
顶点 编号 为 从 0 Zl) n-1. KIE, SE k= 0, FEM 两 ERINE; 对 于 不 存在 进入 弧 (u, v) 的 情 
况 ， 保 存 + co。 和 矩阵 的 更 新 基于 一 个 简单 原则 : 一 条 从 到 v* 并 经 过 顶点 大 的 最 短路 径 由 一 条 从 1z 





























© 热带 数学 (tropical mathematics ) 由 巴西 数学 家 、 计 算 机 科学 家 Imre Simon 于 1980 年 代 提 出 并 发 展 ， 
是 一 种 分 片 线性 化 的 代数 几何 。 译 者 注 
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到 的 最 短路 径 和 一 条 从 到 v 的 最 短路 径 组 成 。 因 此 对 于 ,u,v € {0,…,n 一 1 ， 我 们 计算 : 
W,.= liJi] = min{W,[u][v], Wu] + WAA 
对 于 相同 的 上 ， 它 作为 下 标 和 在 矩阵 中 代表 的 含义 是 一 致 的 : 为 了 计算 Wi[u][v]， 可 以 考虑 通 
过 大 的 路 径 。 











9 9 
图 8.6 ”通过 顶点 释放 距离 ， 能 缩短 从 F v 的 路 径 长 度 


。 实现 细节 
以 下 算法 维护 了 一 个 唯一 数组 W ERER WW.， 并 使 用 参数 来 修改 这 个 权重 矩阵 。 算 法 实现 
能 检测 出 是 否 存在 负 环 ， 并 在 出 现 负 环 的 情况 下 返回 False。 


def floyd warshall (weight): 
V = range (len (weight) ) 
for k in V: 
for u in V: 
for v in V: 
weight[u][v] = min (weight [u] [v], 
weight[u] [k] + weight[k] [v]) 











for v in V: 
if weight[v][v] < 0: # 检测 到 了 负 环 
return True 
return False 











e 检测 负 环 

4AM Pivi] 和 0 时 ,存在 一 个 通过 顶点 的 负 环 。 然 而 ， 正 如 Hougardy 在 参考 文献 [7] 
中 介绍 的 ， 我 们 更 推荐 Bellman-Ford 算法 来 检测 负 环 。 因 为 如 果 存 在 负 环 ， 当 顶点 数量 较 大 时 ， 用 
Floyd-Warshall 算法 计算 出 来 的 绝对 值 可 能 会 呈 指 数 阶 增长 ， 直 到 造成 变量 的 存储 空间 溢出 。 









































8.6 网 格 


e 问题 


给 定 一 个 矩形 网 格 ， 其 中 有 些 格子 是 可 以 通过 的 ， 我 们 和 希望 找到 从 入 口 到 出 口 的 最 短路 径 。 




















。 算法 
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这 个 问题 可 以 采用 一 个 简单 方法 一 一 在 网 格 图 上 的 广度 优先 遍历 算法 。 但 是 ， 相 对 于 显 式 地 建 
立 一 个 图 ,在 网 格 上 直接 做 遍历 反而 更 加 容易 。 给 定 网 格 的 描述 方式 是 一 个 二 维 数 组 ， 其 中 # 字符 





























用 来 表示 不 可 通过 的 格子 ， 空 字符 表示 可 通过 的 格子 。 算 法 的 实现 用 二 台 


数组 来 标注 已 访问 过 的 项 














点 ， 避 人 免 新 造 一 个 额 儿 
源 点 出 发 需要 通过 路 径 的 前 驱 顶 点 。 


的 数据 结构 。 那 么 ， 被 访问 过 的 格子 将 包含 字符 一 、 和 二、 上 、1 ， 注 明了 从 















































def dist gridl(grid, source, target=None): 
rows = len (grid) 
cols = len(grid[0] 
dir = [(0, +1, ">"), (0, =1, "<"), (41, 0, 'v'), (61, 0, rk] 
i, j = source 
grid[i][j] = 's' 
Q = deque () 
Q.append (source) 
while Q: 
il, jl = Q.popleft() 
for di, dj, symbol in dir: # 探索 所 有 方向 
i2 = il + di 
j2 = j1 + a5 
if not(0 <= i2 and i2 < rows and 0 <= j2 and j2 < cols): 
break # 越过 了 网 格 的 边界 
if grid[i2][j2] != ' ': # 不 可 通过 或 已 访问 过 的 格子 
Continue 
grid[i2] [j2] = symbol # 标注 已 经 访问 
if(i2, j2) == target: 
grid[i2][j2] = 't' # 到 达 目 标 
return 
Q.append((i2, j2)) 
e 变种 


对 于 共享 一 个 角落 的 格子 来 说 ， 上 述 实现 能 很 容易 被 修改 ， 从 而 实现 斜 线 移动 。 把 一 个 六 边 形 


网 格 变 为 一 个 有 特殊 相 邻 关系 的 正方 形 网 格 ， 也 能 用 相同 方法 来 处 理 。 图 











8.7 演示 了 上 述 变 换 。 









































— 














图 8.7 使 用 正方 形 网 格 来 表示 六 边 形 网 格 
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8.7 ”变种 问题 


最 短路 径 是 一 个 重要 问题 ， 以 下 将 介绍 几 种 经 典 变种 。 








8.7.1 无 权重 图 
在 一 个 无 权重 图 中 ， 只 需要 执行 一 次 广度 优先 遍历 就 可 以 确定 最 短路 径 。 





























8.7.2 ”有 向 无 环 图 
一 次 拓扑 排序 就 能 以 可 接受 顺序 处 理 所 有 顶点 ( 见 6.8 节 ) : 为 了 计算 从 源 点 到 顶点 v 的 距离 ， 

可 以 首先 计算 到 所 有 v 的 前 驱 顶 点 的 距离 ， 然 后 再 使 用 一 个 简单 的 动态 规划 算法 来 得 到 答案 。 

e 应 用 
在 从 家 走 到 办 公 室 的 路 上 ， 我 想 先 走 上 坡 路 再 走 下 坡 路 ， 以 便 先 运动 、 后 休息 。 为 此 ， 我 找到 

一 张 城市 的 建 模 图 ， 其 中 的 顶点 是 有 高 度 值 的 区 域 交 叉 点 ， 而 边 是 有 长 度 值 的 道路 。 





























8.7.3 最 长 路 径 
上 述 动态 规划 算法 可 以 应 用 在 有 向 无 环 图 上 。 对 于 一 个 通用 图 ， 最 长 路 径 问题 则 在 找到 一 条 从 
源 点 到 目标 顶点， 而 且 只 通过 每 个 顶点 一 次 的 最 长 路 径 。 这 是 个 NP 复杂 问题 ,已 知 任何 算法 都 不 
能 在 多 项 式 时 间 内 解决 该 问题 。 如 果 顶 点 数量 很 少 ， 比 如 在 20 个 左右 ， 那 我 们 可 以 在 顶点 集合 S 
的 子 集中 使 用 动态 规划 算法 ， 并 计算 DSM, MAAE v 的 最 长 路 径 一 定 只 使 用 集合 S 中 的 顶点 作 
为 中 间 节 点 。 如 此 一 来 ， 对 于 所 有 非 空 集合 S， 有 如 下 关系 : 
D{S][v]= max DLS \ul[u]+ wu]ly] 


其 中 Sw 是 集合 S 去 掉 顶 点 后 的 集合 ，w[uj[v] 是 弧 (u,v) 的 权重 。 因 此 ， 基 本 情况 如 下 : 
wfu][v], 如 果 存 在 弧 (u,v) 



























































oom-| 


8.7.4 树 中 的 最 长 路 径 


通常 ， 看 似 复杂 的 问题 在 树 中 会 变 得 简单 ， 因 为 子 树 可 以 利用 动态 规划 算法 找到 解决 方案 。 这 
也 是 树 中 最 长 路 径 问 题 的 情况 ，10.3 节 介 绍 了 一 个 线性 复杂 度 算法 。 
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8.7.5 ”最 小 化 弧 上 权重 的 路 径 


当 我 们 不 希望 路 径 上 的 边 的 总 权重 最 小 ， 而 希望 它 最 大 时 ,使 用 并 查 集 数据 结构 会 更 简单 。 从 
一 个 空 的 图 开始 ， 按 权重 升序 向 图 中 添加 边 ， 直 到 源 点 和 目标 顶点 位 于 同一 个 连通 分 量 中 。 有 向 图 
也 存在 一 个 类 似 解决 方案 ， 但 实现 过 程 相当 复杂 。 


























8.7.6 ”顶点 有 权重 的 图 

考虑 一 个 弧 上 没有 权重 而 顶点 有 权重 的 图 ， 目 的 是 找到 一 条 从 源 点 到 目标 顶点 的 路 径 ， 让 该 路 
径 通过 的 所 有 顶点 的 权重 总 和 最 小 。 我 们 把 每 个 顶点 v 赫 换 为 两 个 顶点 v 和 vw， 这 两 个 顶点 被 权重 
H v 的 弧 连 接 ， 同 时 把 每 个 弧 (zx v) BRKI (ir)， 这 是 本 问题 就 等 价 于 上 一 个 问题 。 











8.7.7 令 顶 点 上 最 大 权重 最 小 的 路 径 


当 一 条 路 径 的 权重 被 定义 为 “路 径 上 中 间 节 点 的 权重 最 大 值 ”时 ， 可 以 使 用 Floyd-Warshal 算 
法 。 只 需 把 所 有 顶点 按照 权重 升序 排列 ， 并 在 找到 从 源 点 到 目标 顶点 的 路 径 时 ， 立 即 结束 扩 代 。 
维护 一 个 保存 着 连通 性 的 布尔 型 数组 C.[u][v]， 数 组 表示 仪 使 用 下 标 小 于 k 的 中 间 节 点 时 ， 是 
否 存 在 一 条 从 u 到 v 的 路 径 。 更 新 方法 如 下 : 
CI] = Caley) V (Cabdi A Call) 






































8.78 所 有 边 都 属于 一 条 最 短路 径 


给 定 一 个 有 权重 的 图 、 一 个 源 点 s 和 一 个 目标 顶点 1+，s 和 上 之 间 可 能 存在 多 条 最 短路 径 。 目 标 
是 确定 所 有 边 是 否 属于 一 条 最 短路 径 。 为 此 ， 我 们 使 用 两 次 Dijkstra 算法 来 处 理 s 和 +， 计算 从 源 点 
s 出 发 到 顶点 v 的 距离 d[s, yw]， 以 及 从 顶点 v 到 目标 顶点 t 的 距离 div, flo E, MHAM 

dis, u] + wlu, v] + dfv, t] = d[s, t] 

存在 一 条 边 (w v) 属于 一 条 最 短路 径 ， 其 中 wu, v] 是 边 的 权重 。 
e 无 向 图 的 变种 问题 

Dijkstra 算法 只 能 处 理 一 个 给 定 源 点 ， 而 不 是 一 个 给 定 的 目标 项 点 。 因 此， 在 计算 所 有 vw 到 1 的 
距离 div, A 时 ， 需 要 暂时 把 弧 反 转 。 









































第 9 章 耦合 性 和 流 


一 般 情况 下 ， 组 合 优化 的 核心 部 分 由 耦合 性 和 流 问 题 组 成 。 这 两 个 问题 彼此 相连 ， 存 在 多 个 变 
种 问题 。 算 法 的 原理 是 对 一 个 解 反复 优化 : 从 起 初 的 空 解 ， 最 终 得 到 一 个 最 优 解 。 

















假设 在 图 9.1 的 二 分 图 ”中 ， 我 们 希望 确定 一 个 完美 匹配 ， 也 就 是 说 ， 把 图 中 左 侧 所 有 顶点 与 
唯一 一 个 右 侧 项 点 相关 联 。 图 中 的 边 表 示 哪 种 关联 是 可 以 实现 的 。 如 果 我 们 从 关联 tay P vy FAR, 














就 会 被 阻挡 。 为 实现 一 个 完美 匹配 ， 必 须 解 开 这 个 关联 。 这 一 原理 将 在 后 面 章节 中 解释 。 
aP AP CA 
G & dy © 


图 9.1 逐渐 建立 起 一 个 完美 匹配 
这 里 介绍 的 流 算法 需要 满足 以 下 条 件 : 对 于 每 一 条 弧 (u, v)， 存 在 其 逆向 弧 (v, w)。 算 法 会 首先 
调用 一 个 方法 ， 以 便 在 必要 时 用 权重 为 0 的 逆向 弧 把 图 补 全 ， 借 此 测试 对 于 每 条 弧 (u, v) ESA u 
FEF v 的 相 邻 节点 列表 。 其 时 间 复 杂 度 为 O( 如 :| 入 ， 在 当前 情况 下 不 可 忽略 。 















































def add_reverse arcs(graph, capac): 
for u in range(len(graph) ): 
for y in graph[u]: 
if u not in graph[v]: 
graph[v] .append (u) 
capac[v][u] = 0 











e 复杂 度 
在 下 表 中 ， 我 们 假设 对 二 分 图 G(U, V, E) 有 |U S|, FC 来 记录 最 大 容量 。 








© 二 分 图 又 称 双 分 图 、 二 部 图 、 偶 图 ， 指 顶点 可 以 分 成 两 个 不 相交 的 集 U 和 V (UV FARA ), 
使 得 在 同一 个 集 内 的 顶点 不 相 邻 (没有 共同 边 ) 的 图 。 译 者 注 
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增 量 路 径 算法 
Kuhn-Munkres 算法 






































Gale-Shapley 算法 














V|-|E|-|C)) Ford-Fulkerson 算法 
V|-\E|-logC) 二 进 制 阻塞 流 算法 





























下 :| Edmonds-Karp 算法 
V-JE) Dinic 算法 

















VP-|E)) Dinic 算法 
Ellog|™) Dijkstra 算法 



































9.1 








e 应 用 

在 nn 个 房间 之 间 修 建 n RER, in 个 工人 分 配 n 项 任务 …… 二 分 图 最 大 匹配 问题 的 应 用 范围 
非常 广 。9.2 节 还 将 介绍 一 个 有 权重 的 问题 。 由 于 这 些 问题 通常 使 用 二 分 图 来 建 模 ， 因 而 我 们 仅 介 
绍 此 类 情况 一 一 当然 ， 这 些 问题 也 可 以 用 其 他 图 类 数据 结构 来 解决 。 


















































e 定义 

设 二 分 图 G(U, V, E)， 且 ESExxyv 。 匹 配 是 集合 MESEE ， 且 在 M 中 不 存在 拥有 公共 顶点 的 两 
条 边 。 目 的 是 找到 一 个 最 大 基数 的 匹配 。 对 于 给 定 集合 M， 当 一 个 顶点 位 于 M 中 的 一 条 边 上 时 ， 
我 们 称 该 顶点 被 匹配 ， 否 则 称 之 为 自由 项 点"。 








DQ 此 处 设 定 的 二 分 图 G(U, V, E P, U 和 V 分 别 是 二 分 图 两 个 不 相交 的 独立 集 ,， 而 已 是 连接 这 两 个 独 
立 集 的 边 的 集合 ; UXV 是 把 所 有 U 中 的 顶点 和 所 有 V 中 的 顶点 一 一 相连 的 边 的 集合 ， 因 此 卫 一 定 
是 UXV 的 子 集 ， 或 者 二 者 相等 。 
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e 关键 测试 

一 个 最 容易 想到 的 优化 解 方法 就 是 从 穷 举 法 开始 ， 直 到 找到 最 优 解 。 为 了 优化 一 个 匹配 ， 需 要 
观察 两 个 匹配 间 的 对 称 差 "。 对 于 一 个 实 线 的 匹配 M 和 一 个 虚线 的 匹配 M'， 二 者 的 对 称 差 M@M 
FH M\M’ U M^M 来 定义 ， 后 者 由 实 、 虚 交 蔡 的 边 构 成 的 路 径 和 环 组 成 。 通 过 参数 计数 可 以 发 现 ， 
当 M| > |M 时 ， 总 存在 一 条 虚线 开关 和 虚线 结尾 的 实 虚 交 蔡 路 径 P 了 (图 9.2 )。 

路 径 P 在 一 个 自由 顶点 开始 和 结束 ， 并 在 属于 M 和 不 属于 M 的 边 之 间 交 替 。 我 们 把 这 种 路 径 
称 作 增 广 路 ， 因 为 M OP 的 差异 是 M 增加 一 条 边 后 的 一 个 匹配 。 

因此 ， 如 果 M 还 不 是 最 大 基数 匹配 ， 那 么 对 于 M 存在 一 条 增 广 路 。 更 准确 地 说 ， 如 果 存 在 一 
个 匹配 M' 使 得 |M1 > |M|， 而 且 一 个 顶点 weU 在 M' 中 是 配对 顶点 ， 但 在 M 中 是 自由 顶点 ， 那 么 
对 于 M 一 定 存在 一 条 从 出 发 的 增 广 路 P。 


e SAEA O(UE|) 的 算法 

上 述 结果 引出 了 第 一 个 算法 。 从 一 个 空 匹配 M 开始 ， 寻 找 M 的 一 条 增 广 路 径 P， 并 用 M 四 了 
来 替换 M， 直 到 找 不 到 P 为 止 。 通 过 深度 优先 遍历 很 容易 就 能 找到 这 样 一 条 增 广 路 径 。 只 需 从 U 
的 一 个 自由 顶点 开始 ， 考 虑 它 还 没有 被 访问 过 的 所 有 相 邻 节点 。 如 果 v* 尚未 被 匹配 ， 那 么 从 根 节 点 
F v 的 路 径 是 一 条 增 广 路 径 ; 如 果 v 已 经 与 一 个 顶点 w 匹配 ， 那 么 从 w' 继续 遍历 。 找 到 并 应 用 一 条 
增 广 路 的 算法 复杂 度 是 O(|E2|)， 现 在 必须 在 最 多 U 个 顶点 上 重复 这 一 操作 ， 于 是 本 算法 的 时 间 复 杂 


度 应 当 是 OUOWIED)。 
eee 
© © 
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9.2 ”对 称 差 M OM’ 由 一 个 颜色 交替 环 、 一 条 M' 的 增 广 路 P 和 两 条 M 的 增 广 路 组 成 








D 对 称 差 为 两 个 集合 的 并 集 减 去 交集 。 译 者 注 
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o 实现 细节 





























在 下 面 介绍 的 实现 上 中, 我 们 用 一 个 数组 m 来 编码 一 个 匹配 , 它 为 每 个 veV 顶点 关联 了 一 个 U 
中 与 之 匹配 的 顶点 ; 否则 ， 假 如 v 是 自由 顶点 ，m[v] = None。 
图 由 数组 巨 给 出 ， 其 中 Elu 是 4 相 邻 顶点 的 列表 。 给 定 顶 点 集合 U 和 V 的 格式 应 该 是 [0,1,…， 





Ul-1] 和 [0, l, Ba | 四 -1]。 


def augment (u, bigraph, visit, match): 
for v in bigraph[u]: 
if not visit[v]: 





visit[v] = True 
if match[v] is None or augment (match[v], bigraph, visit, match): 
match[v] = u # 找到 了 增 广 路 


return True 
return False 


def max bipartite matching (bigraph): 
n = len (bigraph) # UAV 的 范围 相 后 
match = [None] * n 
for u in range(n): 
augment(u, bigraph, [False] * n, match) 
return match 
































e 其 他 算法 

此 外 ，Hopcroft Karp 算法 可 用 来 在 时 间 O(VIV|.E) 内 解决 二 分 图 的 最 大 匹配 问题 。 其 原理 是 
在 同一 次 遍历 中 找到 多 条 增 广 路 ， 并 从 中 选择 最 短 的 增 广 路 。Alt、Blum、Mehlhor 和 Paul ( 见 参考 文 
献 [2] ) 也 找到 了 一 个 有 趣 的 算法 处 理 稠密 图 ( 有 很 多 边 )， 其 时 间 复 杂 度 为 O(V > Vf E|/log|V |) 。 
但 是 ， 所 有 这 些 算法 实现 起 来 都 相当 复杂 ， 没 有 本 节 中 介绍 的 算法 如 此 快速 、 实 用 。 
e 二 分 图 中 的 最 小 覆盖 问题 

给 定 一 个 二 分 图 GU, V, E)， 我 们 寻找 一 个 最 小 的 基数 集合 S CU U V， 使 得 每 条 边 (u, vE 至 
少 拥有 一 个 $ 中 的 末端 顶点 ， 因 此 ues 或 veS。 由 于 一 个 匹配 的 每 条 边 必须 至 少 拥有 一 个 S 中 的 末 
端 顶点 ， 匹 配 的 最 大 值 就 应 该 是 最 小 覆盖 的 下 限 值 。Konig 定理 证 明了 ， 实 际 上 二 者 最 优 值 相等 。 

定理 的 证 明 极 具 建 设 性 ， 给 出 了 一 个 算法 ， 基 于 图 G(U, V, E) 的 一 个 最 大 匹配 来 找到 一 个 最 小 




































































覆盖 。 设 没有 被 M 匹配 的 口中 顶点 集合 Z， 在 Z 中 添加 通过 交替 路 径 能 到 达 的 所 有 顶点 ， 我 们 定 
义 以 下 集合 : 


S=(UZ)U(V NZ) 
集合 Z 的 结构 说 明 ， 对 于 所 有 边 (u, v)eM, WR vez, BAA uezo FIEX F uez, 
起 初 不 与 自由 顶点 器 同 在 Z 中 , u 随 着 匹配 边 才 被 添加 入 过 中 ， 因 此 vezo 
这 证 明了 对 于 每 条 属于 匹配 M 的 边 (u, v)， 其 末端 顶点 要 么 全 都 在 Z 中 ,要么 都 不 在 Z 中 。 所 











Fu 



































© 为 什么 只 有 V 中 的 顶点 在 被 访问 时 被 标记 ? 大 家 可 以 想 一 想 。 
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以 ， 所 有 匹配 的 边 都 有 且 仅 有 一 个 未 端 顶点 在 S 中 , AL IS) = |M] 
我 们 可 以 证 明 $ 覆盖 了 图 的 所 有 边 。 设 (u,v) 是 图 的 一 条 边 。 如 果 ug Z， 边 被 覆盖 ， 那 么 设 

ueZ。 如 果 (u, v) 不 是 匹配 的 一 条 边 ， 那 么 Z 的 最 大 字符 数量 使 得 v 必须 在 Z 中 ， 因 此 v 也 就 在 S 

如 果 (u,v) 在 M 中 ， 那 么 通过 前 面 的 论证 有 veZ， 因 此 veS。 这 就 证 明了 S 是 一 个 顶点 的 履 
这 意味 着 |S) < IMI， 故 而 证 明了 结论 |S] = |M|。 





























9.2 最 大 权重 的 完美 匹配 : Kuhn-Munkres 算法 

















Vo Vi, Vy V3 Vo Vy Vy V3 
wla 5 i 2 "~ EE 
umlo 4 -8 3 ulo 4 -863 
mlo 23 0 u,|0 @®3 o 
ml-1 1 2 -| w/-1 1 @-s 
输入 输出 


e 应 用 

在 一 幢 教 学 楼 里 ， 有 n 节 课 程 要 分 配给 n 位 教师 。 每 位 教师 用 一 个 权重 表 显 示 自 己 对 课程 安排 
的 偏好 。 这 个 权重 被 标准 化 成 总 和 为 1 的 一 系列 数字 ， ae Na 目的 是 找到 课 
程 和 教师 之 间 的 二 分 图 ， 使 得 所 有 课程 分 配 的 权重 和 最 大 。 这 就 是 在 一 个 最 大 收益 二 分 图 中 找 完美 
匹配 的 问题 。 
e 定义 

对 于 一 个 二 分 图 GU, V, E)， 在 每 条 边 上 有 权重 w: E 一 R。 在 不 来 失 普 适 性 的 情况 下 ,假设 
ID|=|V|， 而 且 图 是 个 完全 图 ， 即 E= U9 V。 目 的 是 找到 一 个 完美 匹配 M SE ， 使 得 权重 总 和 ( 又 
称 收益 ) 》 WO RAM P. 




























































































e 变种 
这 个 问题 的 一 个 变种 是 计算 最 小 成 本 的 完美 匹配 。 在 这 种 情况 下 ， 只 需 改 变 权 重 的 正 负 号 ， 并 
采用 最 大 化 收益 的 思路 即 可 。 如 果 |U] > V, Km V 中 加 入 新 的 顶点 ， 并 使 用 权重 为 0 的 边 连接 


























U 中 所 有 顶点 。 由 此 ， 新 图 的 完美 匹配 和 原 图 的 最 大 匹配 就 有 了 相关 性 。 如 果 新 图 不 是 完全 图 ， 只 
需 使 用 权重 为 -oo 的 边 来 补 全 即 ”可 ， 这 些 边 在 寻找 最 优 解 的 过 程 中 一 定 不 会 被 选中 。 
复杂 度 : Kuhn-Munkres 算法 ( 又 称 匈牙利 算法 ) 的 时 间 复 杂 度 为 OVP) 


























DO 在 完全 图 中 ， 所 有 顶点 都 有 且 仅 有 一 条 边 互 相连 接 。 在 判断 收益 或 成 本 的 时 候 ， 可 以 把 原本 不 相连 
的 边 标 注 为 连接 ， 但 权重 为 无 穷 小 或 无 穷 大 ， 因 此 ， 把 一 个 普通 二 分 图 拓展 成 为 完全 图 并 不 会 丢失 
普 适 性 。 译 者 注 





。 算法 





Kuhn-Munkres 算法 属于 原始 - 对 偶 类 算法 ， 











介绍 不 会 使 用 线性 规划 的 术语 。 
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使 用 了 线性 规划 的 建 模 方法 。 为 方便 理解 ， 以 下 





主要 思路 是 考虑 一 个 关联 问题 ， 即 最 小 有 效 顶 标 问题 。 顶 标 是 项 点 上 的 权重 /， 当 所 有 边 (u, v) 


都 满足 


Lu) + 1(v) > 
题 旨 在 找到 总 权 习 





它们 是 有 效 的 顶 标 。 关 联 问 





w(u, v) (9.1) 
最 小 的 有 效 顶 标 。 对 一 个 匹配 所 有 边 (u, v) 上 的 








不 等 式 求 和 ， 很 容易 看 到 ， 有 效 顶 标的 权重 之 和 大 于 完美 匹配 的 权重 。 
顶 标 1 定义 的 集合 Ei 由 满足 以 下 算式 的 所 有 边 (w v) 组 成 

















仅 包含 这 些 边 的 图 被 称 作 等 价 图 。 
MCE,, BAD), | 的 值 等 于 M]. 





最 大 。 


Iu) + Uv) = 
如 果 我 们 考虑 有 效 顶 标 1 和 有 效 顶 标 集合 上 的 一 个 完美 匹配 
HF Y pl 的 值 是 所 有 完美 匹配 的 最 大 值 ， 这 证 明了 M 的 权重 





w(u, v) 








现在 要 建立 一 个 数值 对 (1, M)。 在 所 有 情况 下 ， 算 法 都 有 有 效 顶 标 集合 1 和 一 个 匹配 M S E, o 
算法 用 循环 的 方式 扩展 匹配 M; 如 果 不 能 扩展 了 ， 算 法 会 优化 项 标 ， 即 减 小 项 标 值 的 和 ?。 


e 扩展 匹配 


为 了 扩展 匹配 ， 必 须 在 等 价 



































EAM 和 M 的 边 的 不 同 层级 之 间 交 替 。 








图 中 找到 一 条 增 广 路 ， 所 以 需要 建立 一 棵 交替 树 。 我 们 从 选择 一 个 
自由 顶点 wu 开始 ，uieU 且 没 有 匹配 。 顶 点 uw; 作为 树 的 根 节 点 。 树 在 U 和 V 的 顶点 之 间 交 替 ， 也 在 
通过 深度 侦 历 算法 就 能 建立 这 样 一 棵 交替 树 。 一 旦 v 的 一 个 














叶子 节点 成 为 自由 顶点 ， 那么 从 wi 到 v 的 路 径 就 是 一 条 增 广 路 ， 而 且 通过 这 条 路 径 有 可 能 实现 对 M 
的 扩展 匹配 ， 并 把 M 增加 1。 在 这 种 情况 下， 建立 交替 树 的 过 程 就 终止 了 。 


(2) 


3 Coco 























6) (4) 


3(%_—Yo 3 Coco 





图 9.3 Kuhn-Munkres 算法 的 过 程 。(1) 本 章 一 开始 给 出 了 用 权重 矩阵 描述 的 二 分 图 ， 图 


(1) 中 标注 了 每 个 项 点 的 权重 ， 


记录 了 等 价 图 的 每 条 边 ， 并 用 粗 线 表 示 了 一 个 匹配 


的 所 有 边 ， 用 虚线 表示 了 根 节点 为 us 的 最 大 交 蔡 树 的 边 。 这 棵 树 覆 盖 了 顶点 集合 
Ar 和 A,， 且 无 法 被 扩展 。(2) 优化 项 标 ， 添 加 了 一 条 新 的 边 (u, v3)。(3) ZERE 
含 了 的 自由 顶点 w。(4) 匹配 沿 着 从 us 到 v 的 路 径 扩展 





中 ”优化 顶 标 同样 也 是 降低 总 成 本 ， 这 就 是 本 算法 的 最 终 目的 。 





译 者 注 
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o 交替 树 的 性 质 

现在 考虑 匹配 没 能 被 扩展 的 情况 。 我 们 已 经 建立 了 一 个 交替 树 A， 其 根 节 点 是 自由 顶点 w; 同 
时 ,集合 V mn A 中 任意 一 个 顶点 都 不 是 自由 的 。 我 们 把 U 中 被 交替 树 履 盖 的 顶点 集合 称 作 Au, V 
中 被 A 覆盖 的 顶点 集合 称 作 Ay. 于 是 有 |Avl = +A). 换 一 种 形式 来 说 ，Av 由 树 的 根 节点 以 及 与 
Ar 每 个 顶点 的 匹配 顶点 组 成 。 


© 优化 项 标 

优化 顶 标 时 必须 要 谨慎 : 首先 顶 标 必须 是 有 效 的 ;其 次 树 A 必须 留 在 等 价 图 中 。 因 此 ， 一 旦 我 
们 把 根 节点 为 wu 的 顶 标 减少 一 个 值 A > 0， 就 必须 要 把 树 中 的 后 代 节 点 增加 一 个 相同 的 值 ， 这 样 一 
来 ,我 们 就 能 在 处 理 一 个 节点 时 把 其 后 代 节 点 减少 A。 最 终 ， 优 化 就 是 把 Av 中 所 有 项 点 的 项 标 值 
减少 A， 并 把 Ay 中 所 有 项 点 的 顶 标 值 增加 和 A 。 标 注 的 总 值 一 定 是 严格 减少 的 ， 因 为 do > Mo R 
们 发 现 不 等 式 (9.1) 左右 两 边 的 差 一 一 称 作 裕 度 一 一 在 (wyv)sA 或 meA 的 时 候 被 保留 ， 所 以 树 A 
能 够 留 在 等 价 树 中 。 为 了 保证 标签 有 效 ， 只 需 关注 边 (u, v), HP ueAy 和 vg Ayo 因此 ,我 们 可 以 
确定 A 是 这 些 边 上 的 最 小 裕 度 ( 图 9.3 )。 

























































































o 进步 
当 在 一 条 从 Ay 到 V\A, 的 额外 边 进入 等 价 图 时 ， 以 下 方法 会 生效 ， 尤 其 在 这 条 边 确定 了 最 小 裕 
度 A 时 ， 因 为 其 裕 度 变 成 了 0。 注意， 网 中 其 他 边 可 能 会 消失 ， 但 这 对 本 算法 来 说 不 重要 。 
e 初始 化 

为 了 让 算法 运行 ， 我 们 从 有 效 顶 标 1 和 空 匹 配 M 开始 。 为 了 简化 阐述 ， 对 于 所 有 veV， 我 们 
选择 1(v)=0， 而 对 于 所 有 ueU， 选 择 (u) = max, w(u, v)o 


e 算法 实现 时 间 复 杂 度 为 O(IPI4) 

算法 的 实现 是 一 个 对 weU 顶点 的 外 部 循环 ， 其 中 的 常量 表示 所 有 已 遇 到 的 顶点 都 被 M 匹配 。 
这 个 循环 的 复杂 度 是 O(|7|)。 接 下 来 ， 对 每 个 自由 顶点 厂 建 立 一 棵 交替 树 ， 以 此 尝试 建立 匹配 ， 或 
在 必要 情况 下 优化 顶 标 。 建 立交 替 树 的 过 程 的 复杂 度 是 O(\V?) 0 
每 次 优化 项 标 以 后 ， 交 奉 树 会 增长 ， 特 别 是 |4y 会 严格 增长 , 但 |4y 的 上 限 是 | 局 ， 因 此 匹配 的 
增长 成 本 是 OU， 而 完整 的 时 间 复 杂 度 是 OV) 









































H 








def improve_matching(G, u, mu, mv, au, av, lu, 1v): 
assert not au[u] 


au[u] = True 
for v in range (len (G)): 
if not av[v] and G[u] [v] == lu[u] + lv[v]: 
av[v] = True 








if mv[v] is None or \ 








®© Kuhn-Munkres 算法 理解 起 来 有 一 定 难度 ， 建 议 读者 尝试 结合 程序 代码 来 理解 整个 证 明 算 法 时 间 复 杂 
度 的 逻辑 过 程 ， 以 及 实现 算法 所 使 用 的 数据 结构 。 一 一 译 者 注 
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improve matching(G，mv[v]，mu mv, au, av, lu, lv): 
mv[v] = u 
mu[u] = v 
return True 
return False 


def improve_labels (G, au, av, lu, lv): 
U = V = range (len (G) ) 
delta = min(min(lu[u] + lv[v] - G[u] [v] 
for v in V if not av[v]) for u in U if au[u]) 
for u in U: 
if (aulul): 
lu[u] -= delta 
for v in V: 
if(avi[v]): 
lv[v] += delta 


















































def kuhn munkres (G): 复杂 度 为 O(n^4) 的 最 大 收益 的 完美 匹配 
assert len(G) == len(G[0] 
n = len(G) 
mu = [None] * n 空 匹配 
mv = [None] * n 
lu = [max(row) for row in G] 平凡 标签 
lv = [0] * n 
for u0 in range (n): 
if mu[u0] is None: JARA 
while True: 
au = [False] * n 空 的 交替 树 
av = [False] * n 


if improve_matching(G, u0, mu, mv, au, av, lu, lv): 
break 
improve labels(G, au, av, lu, lv) 
return (mu, sum(lu) + sum(lv) ) 











o 实现 细节 

我 们 用 从 0 到 n-1 的 整数 为 U 和 V 中 的 项 点 进行 编码 。 为 此 ， 必 须 把 1 编码 到 数组 lu 和 4 中 ， 
来 对 应 集合 U 和 V。 同 样 ，mu 和 mv 保存 着 匹配 结果 ， 并 在 当 weU、veV 且 二 者 匹配 的 时 候 ， 有 
mulu] = v, mv[u] = vo 

自由 顶点 以 muju] = None 或 mv[v] = None 来 标记 。 最 终 ， 布尔 型 数组 au 和 av 明确 了 一 个 顶 
点 是 否 被 交 蔡 树 覆 盖 。 
e 算法 实现 的 时 间 复 杂 度 为 O(IVl3) 

为 了 获得 立方 级 的 时 间 复 杂 度 ， 必 须 维 护 一 个 margeVal 数组 来 简化 顶 标 优化 过 程 中 对 裕 度 A 
的 计算 。 那 么 ， 对 于 每 个 满足 veV\Ay 的 顶点 有 : 


margeVal, = min (u) +1(v)— wu, v) 





a 























mi 
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让 以 上 算式 最 小 化 的 项 点 u 存储 在 男 一 个 数组 margeArg 中 。 








这 些 数 组 让 树 的 扩展 过 程 更 容易 了 ， 因 为 每 次 变动 顶 标 后 ， 不 再 需要 从 根 节 点 开始 构 到 
树 。 树 的 构建 过 程 也 不 再 采用 深度 优先 遍历 算法 ， 而 是 以 下 述 方式 来 选择 一 个 新 的 边 。 











EIR 


选择 满足 zeA、v&A 且 使 裕 度 最 小 的 边 (u, v)。 当 裕 度 非 0 时 ， 我们 可 以 按照 前 面 的 算法 来 更 


























新 顶 标 ， 结 果 是 把 (u, v) 的 裕 度 减 小 到 0。 任何 情况 下 ，(w v) 是 一 条 可 被 添加 到 树 中 的 边 时 ， 有 两 
种 情况 要 分 别处 理 。 对 于 还 没有 匹配 的 v， 我们 已 经 找到 了 一 条 增 广 路 ; 对 于 已 和 某 个 顶点 u' 配对 


Mv, 我们 可 以 把 (u', v) 添加 到 树 A 中 ， 继 而 把 w' 添 加 入 A 中， 同时 将 裕 度 在 线性 时 间 内 更 新 ， 





并 重新 开始 。 因 此 ， 找 到 一 条 增 广 路 所 需 时 间 呈 4 次 窜 。 一 旦 U 中 的 一 个 顶点 被 匹配 ， 它 会 被 保留 


出 











在 U 中 ， 所 以 要 寻找 的 只 剩 下 RIH EE. BURA ARE OV). 














这 
是 通过 深度 优先 遍历 建立 起 来 的 ， 所 以 我 们 想 知道 的 信息 必须 被 存储 在 一 个 数组 中 。 当 扩展 一 个 匹 


配 时 ， 我 们 借 此 能 回溯 到 树 的 根 节点 。 把 节点 veAy 的 前 驱 节点 记 为 Ay[v]， 把 树 外 节点 vev\Ay 记 











为 Ayv]= None。 数 组 变量 的 首 字母 大 写 ， 以 便 与 存储 A 的 布尔 型 数组 区 分 。 





数组 marge 统一 表示 了 数组 margeVal 和 margeArg， 并 保存 数据 对 (val, arg)。 





def kuhn munkres (G) : 
assert len(G) == len(G[0] 
n = len(G) 
U = V = range (n) 


mu = [None] * n 

mv = [None] * n 

lu = [max(row) for row in G] 
lv = [0] * n 


for root in U: 
n = len(G) 
au = [False] * n 
au[root] = True 
Av = [None] * n 


while True: 
( (delta, u), v) = min((marge[v], v) 
assert au[u] 
if delta > 0: 
for u0 in U: 
if au[u0]: 
lu[u0] -= delta 
for vO in V: 
if Av[v0] is not None: 
lv[v0] += delta 
else: 

















最 大 收益 完美 匹配 复杂 度 0 (n^3) 
正方 形 矩 阵 


























建立 一 个 交 共 树 


marge = [(lu[root] + lv[v] - G[root][v], root) for v in V] 


for v in V if Av[v] == None) 


# 树 已 经 完成 
# 优化 项 标 





(val, arg) = marge[v0] 
marge[v0] = (val - delta, arg) 
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assert lu[u] + lv[v] == G[u] [v] 
Av[v] =s u 
if mv[v] is None: 
break 
ul = mv[v] 
assert not au[ul] 
au[ul] = True 
for vl in V: 
if Av[v1] is None: 
alt = (lu[ul] + lv[v1] 
if marge[vl] > alt: 
marge[vl] = alt 
while v is not None: 
u = Av[v] 
prec = mu[u] 
mv[v] = u 
mu[u] = v 
v = prec 
return (mu, sum(lu) + sum(lv)) 


把 (u, v) 添加 入 集合 A 


找到 了 交替 路 


把 (ul, v) 添加 入 集合 A 











更 新 裕 度 
G[ul] [v1], ul) 


+ 找到 了 交替 路 径 
+ 沿 着 路 径 向 根 节点 





# 扩展 匹配 








e 最 大 权重 边 的 最 小 完美 匹配 
定义 


设 一 个 二 分 图 (U, V, E)， 边 都 标注 了 权重 w:E 一 Z， 目 的 是 找到 








个 完美 匹配 M。 但 我 们 不 是 


要 最 小 化 M 中 所 有 边 的 权重 和 ， 而 是 最 小 化 M 中 一 条 边 的 最 大 权重 ， 并 在 所 有 完美 匹配 上 计算 


min,, max,_y W(e) o 


把 问题 简化 为 最 大 匹配 问题 


假设 所 有 边 都 按照 权重 升序 排序 ， 对 于 一 个 给 定 的 阔 值 5， 我 们 可 以 测试 图 中 最 前 大 条 边 中 是 
否 存在 一 个 完美 匹配 。 这 一 属性 在 上 上 是 单调 的 ,使 





决 问题 。 




















] 二 分 查找 方式 可 以 在 时 间 区 间 V), E 内 解 


利用 寻找 完美 匹配 算法 的 特殊 运行 机 制 ， 我 们 还 能 把 二 分 查找 的 时 间 复 杂 度 再 次 节省 





O(log|E|)。 








算法 借助 一 条 增 广 路 来 扩展 当前 匹配 ， 以 此 构建 一 个 完美 匹配 。 这 条 增 广 路 来 自 交 蔡 树 森 林 "。 
我 们 把 变量 上 初始 化 为 0， 并 维护 一 个 匹配 M， 以 及 一 个 由 前 左 条 边 组 成 的 交替 树 。 当 交 蔡 树 构建 
完成 ， 却 仍 没有 找到 增 广 路 时 ， 我 们 增 大 大 值 并 把 第 磊 条 边 添加 到 图 中 ， 同 时 更 新 交替 树 。 根 据 当 
前 边 的 数量 ， 每 次 扩展 M 都 需要 线性 时 间 复 杂 度 ， 于 是 ， 找 到 让 图 形成 一 个 完美 匹配 的 最 小 k 值 














所 需 时 间 复 杂 度 为 O(|V] + El) 





© 整个 图 里 面 的 所 有 交替 树 。 





译 者 注 
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93 ”无 交叉 平面 匹配 





co 


输入 Eafe 


e 定义 
图 中 给 定 个 白色 点 和 个 黑色 点 。 假 设 输入 不 会 退化 ， 即 不 存在 3 个 点 共 线 。 目 的 是 在 白色 
点 和 黑色 点 之 间 找 到 一 个 完美 匹配 ， 使 得 当 把 所 有 点 与 其 右 侧 点 连接 时 ， 所 有 连接 线 不 相交 。 








e 关键 测试 
假设 在 某 个 时 刻 ， 点 都 已 形成 了 匹配 ， 但 仍 存在 连接 线 相交 的 情况 。 考 虑 连接 线 相交 的 两 对 匹 
fic u-v Al u'-v' (图 9.4)， 当 把 它们 的 关联 改 成 uw-v' 和 w'-v 时 ， 连 接线 就 不 相交 了 。 那 么 ， 这 一 操作 
能 不 能 优化 解 呢 ? 
我 们 注意 到 ， 在 执行 上 述 解除 交叉 的 方法 后 ， 交 叉 线 的 数量 反而 可 能 会 增加 ， 如 图 9.4 所 示 。 因 
此 ， 这 不 是 优化 解 的 正确 方法 。 相 反 ， 所 有 连接 线 的 总 长 度 减 少 了 。 这 个 测试 把 我 们 带 回 第 一 种 算法 。 



























































图 9.4 解除 匹配 中 存在 的 交叉 
o 不 保证 性 能 的 算法 
在 两 部 分 中 随机 地 匹配 点 。 由 于 存在 两 条 相交 连 线 ， 因 而 需要 用 上 述 方法 解除 交叉 。 通 过 前 面 
的 论证 ， 这 个 算法 保证 能 找到 一 个 解 。 根 据 我 们 的 经 验 ， 在 实践 中 该 算法 的 性 能 很 好 。 
e 减 小 完美 匹配 最 小 成 本 的 算法 复杂 度 为 Oln’) 
定义 一 个 完全 二 分 图 G(U, V, E), 满足 U 中 保存 所 有 白色 点 ，V 中 保存 所 有 黑色 点 ， 而 且 对 于 
所 有 ueA 和 veV， 边 (u, v) 的 成 本 是 两 点 间 的 欧 氏 距离 。 前 面 的 论述 证 明 ， 最 小 成 本 的 完美 匹配 一 
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定 没 有 交叉 。 因 此 ， 只 需 在 图 上 应 用 Kuhn-Munkres 算法 就 能 解决 问题 。 但 是 ， 我 们 意识 到 工作 量 
太 大 ， 因 为 一 个 没有 交叉 的 匹配 不 一 定 成 本 最 小 。 


e SEA O(nlogn) 的 算法 

基于 “火腿 三 明治 ”理论 ， 有 一 个 更 好 的 算法 。Banach 在 1938 年 提出 ， 当 图 中 及 FR 
入 个 白 点 ， 并 且 它 们 处 于 非 退 化 位 置 (不 存在 3 点 共 线 ) 的 时 候 ， 一 定 存在 一 条 直线 ， 使 得 直线 
两 边 有 同样 多 的 白 点 和 黑 点 ， 精 确 地 讲 是 直线 每 侧 各 n/2 个 。 事 实 上 ， 如 果 n 是 奇数 ， 这 条 直线 一 
定 会 通过 一 个 白 点 和 一 个 黑 点 ; 如 果 n 是 偶数 ， 直 线 不 会 通过 任何 点 。 

1994 年 ，Matousek Lo 和 Steiger 提出 的 算法 能 在 O(n) 时 间 内 找到 这 条 直线 ( 见 参考 文献 [22] ), 
但 算法 的 实现 比较 复杂 。 

这 会 有 什么 帮助 吗 ? 在 确保 不 存在 3 点 共 线 的 前 提 下 ， 我 们 可 以 得 到 如 下 属性 : n 为 偶数 时 ， 
分 割 线 不 会 通过 任何 点 ; n 为 奇数 时 ， 分割 线 一 定 会 通过 一 个 白 点 和 一 个 黑 点 ， 此 时 就 可 以 把 二 者 
匹配 起 来 。 无 论 如 何 ， 我 们 都 可 以 在 分 割 线 切 分 的 两 个 独立 空间 中 用 迭代 法 进行 匹配 。 这 个 递归 拆 
分 过 程 的 深度 是 O(logyn)， 因 此 算法 的 最 终 复杂 度 是 O(nlogn)。 














































































































9.4 稳定 的 婚姻 : Gale-Shapley 算法 


° 定义 

假设 有 nn 位 女性 和 nn 位 男性 ， 每 位 男性 都 对 女性 做 了 一 个 偏好 排列 ， 而 女性 也 对 男性 做 了 
同样 的 偏好 排列 。 一 次 婚姻 就 是 在 男性 和 女性 的 二 分 图 上 形成 一 个 完美 匹配 。 假 设 不 存在 一 个 
男性 1 和 一 个 女性 j， 令 丈夫 更 偏好 女性 j 而 非 自 己 的 配偶 ， 或 者 令 妻 子 更 偏好 男性 i 而 非 自 己 
的 配偶 ， 这 次 婚姻 被 称 作 稳定 。 目 标 是 通过 2n 个 偏好 列表 找到 一 个 稳定 婚姻 关系 。 解 决 方案 不 
是 唯一 的 。 

复杂 度 : 使 用 Gale-Shapley 算法 的 复杂 度 为 O(n?)。 
e 算法 

算法 从 没有 已 婚 夫妇 的 情况 开始 。 然 后 ， 只 要 仍 存在 男性 单身 者 ， 算 法 就 会 选择 一 个 单身 男性 
i 和 i 最 偏爱 的 女性 j。 算 法 尝试 让 i 和 j 结婚 。 如 果 j 仍然 单身 ， 这 个 操作 会 被 执行 ， 如 果 j 已 经 和 
一 个 男 们 结婚 ,但 她 更 偏好 i 而 非 k。 在 这 种 情况 下 ，k 只 能 回 到 单身 男性 的 行列 中 ?。 


















































































































































@ 参照 上 述 解 除 交叉 法 来 解除 一 个 匹配 并 连接 另 一 个 匹配 。 男 性 先 与 自己 更 偏好 的 女性 匹配 ， 但 如 果 
女性 相对 于 这 个 匹配 有 更 偏好 的 单身 男性 可 选 ， 那 么 就 会 选择 自己 更 偏好 的 匹配 ; 而 失去 匹配 的 男 
性 就 要 重复 进行 这 一 操作 ， 选 择 自己 当下 最 偏好 的 女性 继续 尝试 匹配 。 因 此 ， 女 性 每 次 都 可 以 和 自 
己 更 偏好 的 男性 匹配 ， 而 男性 每 次 重新 确定 的 匹配 都 是 比 与 原配 更 差 的 选择 。 译 者 注 
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e 分 析 











对 于 复杂 度 来 说 ， 所 有 配对 (G, j) 最 多 仅 被 算法 考虑 一 次 ， 那 么 确定 每 对 夫 
为 了 确保 有 效 ， 只 需 在 算法 过 程 中 测试 : (1) 一 个 给 定 女 性 与 她 更 












































届 好 的 男性 结婚 ; (2) 男性 


妻 的 工作 就 是 常量 。 
与 他 更 


不 偏好 的 女性 结婚 。 我 们 通过 反 证 法 来 证 明 算法 的 有 效 性 。 假 设 最 终 存 在 一 个 男性 i 与 一 个 女性 j 



































结婚 ， 而 一 个 女性 j 与 一 个 男性 i 结婚， 而 且 i 相对 于 j' 更 偏好 j, j 相对 于 i 更 


RF i。 通 过 测试 


(2)， 算 法 在 某 个 时 刻 已 经 考虑 了 配对 (i, j), 














胆 根 据 测 试 1)， 算 法 应 该 没有 将 i 与 j 匹配 ， 也 就 是 


说 ， 当 算法 考虑 配对 G, j) 


时 , j 本 该 已 经 与 比 起 i 更 偏好 的 k 结 婚 了 。 这 和 最 终 她 G) 与 自己 相对 





于 i 更 不 喜欢 的 男人 (i') 结 了 婚 的 事实 矛盾 。 


e 实现 细节 





在 实现 中 ， 男 性 和 女性 都 被 从 0 到 n-1 编号 。 输 入 数据 由 两 个 数组 组 成 。 数 组 men 保存 了 每 


男性 对 nn 个 女性 偏好 顺序 (rank )， 按 降序 排列 。 
women 变换 为 数组 rang， 保 存 每 个 女性 j 对 每 个 男性 





个 











数组 women 保存 了 女性 的 偏好 。 首 先 ， 数 组 
Ei 的 偏好 次 序 。 例 如 ， 假 如 rank[{][i]=0, ABA 











男性 i 是 女性 j REZI, m rank[j[i] = 1 则 意 
最 终 ， 数 组 husband 保存 了 所 有 女 1 
列表 。 对 于 每 个 男性 1，next[i] 表示 其 


























味 着 i 是 j 的 第 二 选择 ， 以 此 类 推 。 


性 被 匹配 的 男性 。 而 unmarried 保存 了 仍 是 单身 状态 的 男性 
扁 好 列表 中 下 一 





个 尝试 匹配 的 女性 编号 。 





def gale shapley(men, women) : 
n = len(men) 


assert n == len(women) 

next = [0] * n 

husband = [None] * n 

rank = [[0] * n for j in range(n) ] 


for j in range(n): 
for r in range (n): 
rank[j] [women[3] [r]] 
unmarried = deque (range (n) ) 
while unmarried: 
i = unmarried.popleft () 


E 


j = men[i] [next[i]] 
next[i] += 1 
if husband[j] 
husband[j] 
elif rank[j] [husband[j]] 
unmarried.append (i) 
else: 
unmarried.put (husband[j]) 
husband[j] 
return husband 


is None: 


i 
< rank[3] [i 


ï 








# 建立 偏好 排序 rank 











# 所 有 男性 者 
# SAGE 





是 单身 
未 匹配 男性 的 时 候 

















]3 


# 对 不 起 ，husband[j] 被 解除 匹 
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9.5 Ford-Fulkerson 最 大 流 算 法 























e 应 用 
寻找 飞机 乘客 玻 散 路 线 中 的 瓶颈 或 者 电网 中 的 电阻 ， 很 多 问题 都 可 以 用 图 的 最 大 流 问 题 来 
建 模 。 
e 定义 
给 定 一 个 有 向 图 G(V, A)， 并 在 弧 上 标注 容量 c: A->R+， 选 择 两 个 独立 顶点 : 一 个 源 点 seV 和 
一 个 汇 点 teV。 为 了 保持 普 适 性 ,假设 对 于 所 有 弧 (u, v), I, w 也 在 图 中 ， 因 为 我 们 总 能 在 图 中 
添加 容量 为 0 的 弧 ， 而 不 改变 最 优 解 。 一 个 流 是 一 个 函数 A->R， 它 满足 以 下 条 件 : 
VvV(u,v)e A: f(u,v) =—f(v,u) 




















(9.2 
对 于 所 有 容量 值 ， 它 满足 : 
Vee A: f(e)<c(e) (9.3 
同样 ， 把 流转 换 为 项 点 (除了 源 点 和 汇 点 ) A: 
Yve V sA: >, af (uv)=0 (9.4 


流 的 值 是 离开 源 点 的 容量 值 ， 忆 f(s,v) 。 目 的 是 找到 一 个 值 最 大 的 流 。 
对 于 无 向 图 ， 我 们 把 每 条 边 (u, v) 蔡 换 成 两 条 容量 一 致 的 边 (Wy) A (v, 由。 
。 剩余 图 和 增 广 路 径 
对 于 一 个 给 定 的 /， 我 们 考虑 一 个 由 剩余 容量 cu, )-Aus v) 为 正 值 的 所 有 弧 u, 组 成 的 剩余 
图 。 在 图 中 ， 一 条 从 s 到 的 路 径 被 称 作 增 广 路 径 ， 因 为 我 们 可 以 沿 着 这 条 路 径 来 扩展 流 ， 扩 展 什 


A 是 路 径 P 的 弧 的 剩余 容量 最 小 值 。 为 了 在 扩展 fu, v) 时 保证 (9.2) 成 立 ， 必 须 把 fu, v) 减 小 同样 
的 值 。 
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e SEH O(IVI - |Al- ICI) 的 Ford-Fulkerson 算法 

其 中 C = max,ey c(a)。 为 了 让 算法 能 够 终止 ， 所 有 容量 必须 是 整数 。 使 用 循环 方法 ,算法 会 寻 
找 一 条 增 广 路 径 P 并 沿 着 P 扩展 流 。 通 过 深度 优先 遍历 找到 增 广 路 径 ， 我 们 仅 能 保证 在 每 次 遍历 过 
程 中 ， 流 会 严格 增长 。 流 的 值 会 明显 增长 xzC， 最 终 得 到 所 需 复 杂 度 。 











e 实现 细节 

在 我 们 介绍 的 实现 中 ， 图 以 邻接 数组 的 方式 给 出 。 但 为 了 简化 对 流 的 操作 ， 我 们 用 一 个 二 维 拢 
MF RAAT. Augment 方法 尝试 沿 着 通 向 汇 点 的 路 径 ， 借 助 一 个 最 大 值 val 来 扩展 流 。 如 果 成 
功 ，Augment 方法 返回 流 增加 的 值 ;， 如 果 失 败 ， 则 返回 0。 本 方法 通过 深度 优先 遍历 找到 这 条 路 径 ， 
并 用 visit 标记 。 






































def augment (graph, capacity, flow, val, u, target, visit): 
visit[u] = True 
if u == target: 
return val 
for v in graph[u]: 
cuv = capacity[u] [v] 








if not visit[v] and cuv > flow[u] [v]: # 可 通过 的 弧 
res = min(val, cuv - flow[u] [v]) 
delta = augment (graph, capacity, flow, res, v, target, visit) 
if delta > 0: 
flow[u][v] += delta # 扩展 流 
flow[v][u] -= delta 


return delta 
return 0 


def ford fulkerson(graph, capacity, s, t): 
add reverse arcs(graph, capacity) 
n = len(graph) 
flow = [[0] * n for _ in range(n) ] 
INF = float('inf') 
while _augment (graph, capacity, flow, INF, s, t, [False] * n) > 0: 


pass # 空 的 循环 体 
return (flow, sum(flow[s])) + 流 和 流 的 值 











e 以 二 进 制 阻塞 流 算法 进行 优化 的 复杂 度 为 O(IV1* lAl + logc) ( 见 参 考 文献 [12] ) 

一 个 可 能 的 优化 算法 是 ， 不 再 简单 地 扩展 第 一 条 已 找到 的 路 径 ， 而 是 每 次 扩展 一 个 较 大 的 
值 。 具 体 来 讲 ， 设 图 中 边 上 的 最 大 容量 为 C; A 最 大 不 超过 C 的 2 和 客 次 (如果 C 是 9， 那么 A 
是 8; C 是 21, A 是 16; C 是 32, A 也 是 32)。 我 们 尝试 循环 使 用 容量 至 少 是 A 的 增 广 路 径 来 
扩展 流 。 当 这 个 操作 无 法 实现 时 ， 我们 可 以 尝试 使 用 相当 于 二 分 之 一 A 值 的 剩余 容量 值 来 扩展 
路 径 。 当 剩余 图 中 的 s 和 1 都 断 开 连 接 时 ，A = 1 的 最 终 状态 结束 ， 这 时 算法 一 定 能 计算 出 一 个 
最 大 流 。 

在 最 初 状态 中 ,根据 C 的 定义 ,我们 知道 最 大 流 的 上 限 值 是 V C。 因 此 ， 最 初 状态 最 多 只 能 
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找到 条 增 广 路 径 。 找 到 一 条 增 广 路 径 的 复杂 度 为 O(PIHdh)。 由 于 只 存在 loge 个 状态 ,算法 的 总 
复杂 度 就 成 了 OVI A| logC). 











9.6 Edmonds-Karp 算法 的 最 大 流 


e 分 析 结论 

Ford-Fulkerson 算法 不 是 多 项 式 时 间 内 解决 问题 的 算法 ， 它 与 输入 数据 量 大 小 呈 指 数 关系 。 笠 
好 有 一 个 转换 方法 ,能 让 其 复杂 度 成 为 多 项 式 时 间 复 杂 度 ， 并 独立 于 Co 

令 人 吃惊 的 是 ， 当 我 们 应 用 最 短 增 广 路 径 时 ， 同 样 算法 的 复杂 度 与 最 大 容量 无 关 。 思 路 是 最 短 















































增 广 路 径 的 长 度 随 着 每 次 对 | 可 的 迭代 严格 递增 。 我 们 由 此 得 到 以 下 结论 。 
一 ERDER L, H s 在 第 0 层 ， 所 有 从 s 出 发 且 经 过 一 条 不 饱和 弧 ”到达 的 顶点 为 第 一 层 的 
顶点 ， 以 此 类 推 。 因此， 这 是 一 个 剩余 图 的 无 环 子 图 。 














一 在 剩余 图 中 ， 一 条 从 s 到 /的 最 短路 径 一 定 是 分 层 图 中 的 一 条 路 径 。 当 我 们 沿 着 这 条 路 径 扩 
展 流 时 ， 其 中 一 条 弧 会 变 成 饱和 弧 。 
沿 着 一 条 路 径 的 一 次 扩展 会 让 某 些 弧 变 得 不 饱和 ,但 仅 是 那些 通 向 更 低层 的 弧 。 因 此 ， 那 
些 变 成 可 通过 状态 的 弧 不 能 减少 从 s Bil v 的 路 径 长 度 (这 一 长 度 用 弧 的 数量 计算 )。 相 应 
th, Mev 到 1 的 路 径 长 度 也 无 法 减少 。 




















改变 所 在 层次 。 通 过 前 面 的 结论 可 以 发 现 ， 从 s 到 + 的 距离 是 严格 增长 的 。 
1 于 只 存在 n 层 ， 因 而 总 共 只 会 有 | 中 :|2| 次 迭代 。 
一 寻找 最 短路 径 通 过 时 间 复 杂 度 为 OV) 的 广度 优先 算法 实现 ， 总 时 间 复 杂 度 是 O(|7 EP 
时 间 复 杂 度 为 OV: EP K Edmonds-Karp 算法 : 从 一 个 空 的 流 开 始 ， 只 要 存在 增 广 路 径 ， 
就 沿 着 最 短 增 广 路 径 进行 拓展 。 
e 实现 细节 
一 个 队列 Q 的 帮助 下 ， 广 度 优先 算法 能 找到 最 短 增 广 路 径 。 数 组 P 有 两 个 作用 。 一 方面 ， 
它 用 于 标注 已 被 广度 优先 算法 遍历 过 的 项 点”。 在 这 种 情况 下 ， 我 们 没有 简单 标注 “是 ”或 “ 否 ”， 
而 是 在 内 存 中 保存 从 路 径 源 点 到 相关 顶点 的 路 径 。 另 一 方面 ， 我 们 借 此 跟着 PP 值 回溯 到 源 点 ， 从 而 
沿 着 路 径 来 扩展 流 。 对 于 每 个 已 经 访问 过 的 顶点 v， 数 组 4 保存 沿 着 从 源 点 到 v 路 径 的 最 小 剩余 容 
量 值 。 使 用 数组 4， 我 们 可 以 确定 沿 着 这 条 增 广 路 径 能 把 这 个 流 扩展 到 多 大 。 



















































































© 由 于 和 A 值 不 超过 C 的 2 次 款 ， 且 每 次 都 会 减 半 ， 因 而 状态 数量 一 定 是 log)C。 一 一 译 者 注 
© 当 流 达到 了 弧 的 容量 的 时 候 弧 是 饱和 弧 。 
© 想 一 想 ， 为 什么 要 标注 P[source] ? 
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def _augment (graph, capacity, flow, source, target): 
n = len(graph) 


A = [0] * n # Alvl= WEAR v 的 路 径 的 最 小 剩余 容量 





augm path = [None] * n # oe = 尚未 访问 过 的 顶点 
Q = deque () # 广度 优先 遍历 
Q.append (source) 
augm_path[source] = source 
A[source] = float('inf') 
while 0: 
= Q.popleft () 
for v in graph[u]: 
cuv = capacityl[u] [v] 














residual = cuv - flow[u] [v] 
if residual > 0 and augm_path[v] is None: 
augm path[v] = u + 储存 遍历 过 的 点 
A[v] = min(A[u], residual) 
if v == target: 
break 
else: 
Q.append (v) 
return (augm path, A[target]) # 增 广 路 径 ， 最 小 剩余 容量 


def edmonds karp(graph, capacity, source, target): 
add reverse arcs (graph, capacity) 
V = range (len (graph)) 
flow = [[0 for v in V] for u in V] 
while True: 


augm path, delta = augment (graph, capacity, flow, source, 


if delta == 
break 
v = target # 回溯 回 源 点 
while v != source: 
u = augm path [v] # 扩展 流 
flow[u][v] += delta 
flow[v][u] -= delta 
v=u 
return (flow, sum(flow[source])) # 流 ， 流 的 值 


























target) 








9.7 Dinic 最 大 流 算 法 


e 复杂 度 为 O(IPlz. IEI) 的 Dinic 算法 








Dinic 算法 与 前 述 算法 是 同时 间 被 找到 的 。 这 次 ， 我 们 没有 在 一 个 增 广 路 径 的 集合 中 一 个 个 地 
个 流 。 算 法 复杂 度 变 成 











搜索 ， 直 到 s 和 1 之 间距 离 增 加 ， 而 是 使 用 唯一 一 次 遍历 就 找到 这 
TOUTED 











设想 一 个 因数 dinic(u, val) ， 它 试图 在 一 个 分 层 图 中 让 一 个 流 从 到 1 通过 。 





文 样 一 


BR 
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流 不 能 超过 val。 函 数 返回 这 个 流 的 值 ， 通 过 调用 w 的 顺序 ， 沿 着 从 s 到 4 的 路 径 扩展 流 。 具 体 来 





UE, 为 了 把 一 个 值 为 val 的 流 从 推动 到 +， 我 们 在 分 层 图 中 遍历 所 有 的 相 邻 顶 点 v， 并 用 递归 














方式 让 最 大 流 从 v 通 向 te 流 的 总 和 就 是 能 把 “推动 到 上 的 最 大 流 。 
函数 dinic(u, val) 会 检测 顶点 1 是 否 无 法 从 wu BGA, M u 到 1 是 否 不 再 有 
































任何 流 。 如 果 


是 ， 函 数 会 从 分 层 图 中 去 掉 wx， 只 需 简单 把 它 设 定 为 “不 存在 ”的 -1 级 别 。 这 样 一 来 ， 随 后 的 调用 


不 必 尝 试 从 通过 一 个 流 。 很 明显 ， 在 O(n) KERE, s 和 + 会 断 开 连 接 ， 然 后 我 们 
新 的 分 层 图 (图 9.5 )。 

即便 使 用 一 个 邻接 数组 来 表示 图 ， 用 和 矩阵 来 表示 流 的 剩余 容量 也 非常 有 效 。 要 注 
都 满足 对 称 性 flu, v) = -fty, u)o 








重新 计算 一 个 





意 ， 每 个 操作 





def dinic(graph, capacity, source, target): 



































assert source != target 
add_reverse arcs(graph, capacity) 
Q = deque () 
total = 0 
n = len(graph) 
flow = [[0] * n for u in range(n) ] # 初始 状态 的 空 流 
while True: # 当 可 以 扩展 的 时 候 重 
Q.appendleft (source) 
lev = [None] * n # 按 层 建立 ， 不 可 到 达 的 时 候 =None 
lev[source] = 0 + 使 用 广度 优先 遍历 
while Q: 
u = Q.pop() 
for v in graph[u]: 
if lev[v] is None and capacity[u][v] > flow[u] [v]: 





lev[v] = lev[u] + 1 
Q.appendleft (v) 








if lev[target] is None: # 当 汇 点 无 法 到 达 的 时 候 停止 
return flow, total # UB = 上 界 
UB = sum(capacity[source] [v] for v in graph[source]) - total 


total += dinic step(graph, capacity, lev, flow, source, target, UB) 
def dinic_step(graph, capacity, lev, flow, u, target, limit): 
if limit <= 0: 





return 0 
if u == target: 
return limit 
val = 0 
for v in graph[u]: 
residuel = capacity[u] [v] - flow[u] [v] 
if lev[v] == lev[u] + 1 and residuel > 0: 
z = min(limit, residuel) 
aug = dinic_step(graph, capacity, lev, flow, v, target, z) 
flow[u] [v] += aug 
flow[v] [u] -= aug 
val += aug 
limit -= aug 
if val == 0: 
lev[u] = None # 去 掉 无 法 到 达 的 顶点 





return val 
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。 实现 细节 
数组 lev 保存 着 一 个 





顶点 在 分 层 图 中 的 层 





层级 。 当 再 也 不 能 从 源 点 提 


重新 计算 。Dinic_step 方法 会 尽 可 能 多 地 把 流 从 推动 到 汇 点 ， 而 





了 实现 这 一 点 ， 它 在 分 层 














图 中 把 尽 可 能 多 的 流 推动 到 自己 的 相 邻 项 点 ， 





氏 达 汇 点 时 ， 这 个 图 会 被 
且 不 超过 给 定 的 限制 。 为 
然后 在 val 中 汇总 已 推 








动 过 的 流 的 数量 。 当 没有 任何 一 个 流 从 源 点 离开 时 ， 顶 点 v 就 被 设置 在 None 层 ， 从 而 从 分 层 


图 中 移 除 。 
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49.5 Dinic 算法 过 程 中 的 分 层 图 演化 。 图 中 仅 展 示 了 通 向 下 一 层 的 弧 ， 弧 用 .je 


来 标注 , 


HY fen, 是 容量 。 





无 法 抵达 的 饱和 弧 用 截 线 表 示 ， 即 将 成 为 


分 层 图 一 部 分 的 弧 用 点 线 表示 。 在 沿 着 路 径 s-2-4-t 把 流 扩展 了 4 以 后 ， 项 
点 1 被 断 开 。 这 时 必须 重新 计算 分 层 图 ， 重 算 后 的 分 层 图 在 最 下 方 


第 9 章 ”耦合 性 和 流 | 125 


9.8 s-t 最 小 割 


。 应 用 
在 敌国 ， 城 市 之 间 以 道路 连接 ， 排 毁 每 条 道路 都 需要 一 些 成 本 。 给 定 两 个 城市 s 和 +t， 目的 是 
以 最 小 成 本 来 断 开 从 s 到 1 的 道路 连接 。 
。 定义 
问题 的 一 个 例子 是 包含 两 个 不 同 顶 点 Fl 的 有 向 图 GV, A)， 每 条 弧 e REE A-R s-t] 
就 是 一 个 集合 SeV， 包 含 s 但 不 包含 FIRE, HIS 有 时 以 离开 S 的 弧 来 定义 ， 即 那些 满足 veS 和 
veS 的 弧 (u, v) ( 图 9.6 )。 割 的 值 是 这 些 弧 的 总 成 本 。 算 法 则 在 找到 一 个 成 本 最 小 的 制 。 






































图 9.6 s-t 的 一 个 最 小 割 S， 成 本 为 3+2+2+1=8。 离开 S 的 弧 用 实 线 表示 

e 与 最 大 流 问题 的 关系 

我 们 用 一 个 最 小 割 问题 的 成 本 c 来 识别 一 个 最 大 流 问题 的 容量 c。 所 有 流 必 须 通过 这 个 制 ， 因 
此 所 有 制 的 值 都 是 所 有 流 的 值 的 上 界 。 但 两 者 还 存在 如 下 更 强 的 关系 : 

最 大 流 最 小 割 ( Max-flow min-cut ) 定理 指出 ， 最 大 流 的 值 与 最 小 割 的 值 相等 。 

这 一 定理 在 1956 年 由 Elias, Feinstein 和 Shannon 证 明了 一 部 分 ， 由 Ford 和 Fulkerson 证 明了 
另 一 部 分 。 证 明 由 一 系列 简单 测试 组 成 。 

1， 对 于 一 个 离开 制 $ 的 流放 如 /CS)=> Fv)» AS) 的 数量 对 所 有 S 都 一 样 。 证 明 方 

式 很 简单 ， 因 为 对 于 所 有 wg S$，w At, Seat (9.4) 和 (9.2)， 有 : 


f= > fuv= > fuv wv) 









































ueS veS ueS veS v 

= DY fuy+ > faw+ DV Sw oo 
UES VES ,VW ues ueS ugs 

= > fuv=f(SUw) 

ueSUw,veSUw 








2. 通过 (9.3) A AS) <c(S), BUFFS 的 流 永 远 不 会 比 S 的 值 大 。 这 证 明了 理论 的 一 半 ， 即 最 
大 流 的 最 大 值 是 最 小 割 的 值 。 
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3， 现 在 ， 如 果 给 定 一 个 流 /， 对 于 所 有 制 S 都 有 J(S) < c(9)， 那 么 存在 一 条 增 广 路 径 ， 只 需 设 
定 S=s 且 P= 名。 由 于 f5) <c(9)， 因 而 存在 一 条 边 (u,v) 满 足 ueS 和 veS ， 且 Ho v) 
<c(u, v)。 我 们 把 (u, v) 添加 到 P 中 。 如 果 v = t, IMA P 就 是 一 条 增 广 路 径 ， 否 则 把 vy 添加 
到 S 中 重新 开始 。 























。 算法 

这 就 给 出 了 解决 最 小 割 问题 的 一 个 算法 。 首 先 计算 最 大 流 ; 然后 在 剩余 图 中 ， 通 过 剩余 容量 为 
正 值 的 弧 ， 可 以 确定 从 s 出 发 能 到 达 的 顶点 v 的 集合 S。 这 样 一 来 ， 由 于 流 有 最 优 解 就 不 该 存在 一 
条 增 广 路 径 ， 因 而 S 不 包含 t。S 值 最 大 化 特性 让 所 有 离开 它 的 弧 都 被 流 饱 和 ，S 的 剩余 容量 是 0， 
所 以 S 是 一 个 最 小 割 。 
































9.9 平面 图 的 s-t 最 小 割 
































e 平面 图 

当 图 是 平面 图 了， 而 且 给 定 了 平面 的 租 入 方式 时 ，s-t 最 小 割 问题 能 更 有 效 地 解决 。 为 了 简化 措 
B, 我们 假设 图 是 一 个 平面 网 格 。 网 格 由 边 连接 起 来 的 项 点 组 成 ， 边 把 图 切 分 成 一 个 个 蜂窝 单元 。 
设想 网 格 是 矩形 的 ， 源 点 在 左下 角 ,， 汇 点 在 右上 角 。 
° 双 面 图 

在 一 个 双 面 图 中 ， 每 个 蜂窝 单元 都 是 一 个 项 点， 且 存 在 两 个 额外 的 项 点 s' 和 t。 顶 点 s' 代 表 网 








格 的 左上 角 , t' 代 表 网 格 的 右 下 角 。 如 果 两 个 顶点 在 原始 图 中 被 一 条 边 分 开 ， 它们 会 在 新 图 中 被 重 






































新 连接 。 两 条 边 的 权重 是 一 样 的 (图 9.7 )。 
O— 3 —O— 1—O— 2-4) ® 
3 1 2 
6 2 8 10 
6 2 8 10 
1 7 2 
7 2 
4 3 1 4 4 3 1 4 
6 4 1 
6 4 1 
5 2 1 3 
5 2 1 3 
7 6 2 
































(s}—7—O— 6 —O— 2—O E) 


图 9.7 ”左边 是 原始 图 ， 右 边 是 双 面 图 : 最 短路 s't' BHA hE s-t 





D 一 个 图 车 能 在 平面 中 描绘 ， 而且 任何 边 不 出 现 交 又 ， 它 就 是 平面 图 ， 换 身 话 说 ， 当 图 中 一 个 顶点 与 
另 一 顶点 相连 ,使 得 所 有 边 ( 两 点 间 线 段 ) 仅 在 顶点 交叉 时 ， 图 即 为 误 入 平面 。 译 者 注 
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e 关键 测试 
在 双 面 图 中 ， 所 有 长 度 为 w 的 路 径 s'-t' 对 应 着 平面 图 中 值 为 w HIRI s-t, ZIR. 
e 复杂 度 为 O((IVI + lEllog Vl) 的 算法 
为 了 计算 这 个 矩阵 中 的 最 小 制 ， 只 需 使 用 Dijkstra 这 一 类 算法 找到 双 面 图 中 的 最 短路 径 即 可 。 


e 变种 

关键 问题 在 于 找到 一 个 把 图 切断 的 最 小 制 ， 也 就 是 说 ， 在 所 有 顶点 对 (s, A 上 的 最 小 割 s-t。 这 
个 问题 可 以 使 用 Stoer-Wagner 算法 在 时 间 OV + EHV Pogy) 内 解决 ， 它 要 比 为 每 个 顶点 对 (s, 四) 在 
时 间 O (VP) 内 切割 s-t 更 有 意义 ( 见 参考 文献 [25] )。 





















































9.10 ”运输 问题 


流 问 题 的 一 个 推广 问题 是 运输 问题 ， 其 中 存在 多 个 源 点 和 多 个 汇 点 。 实 际 上 ， 每 个 顶点 vV 有 一 
Ndo “d WE, 表示 对 外 供应 货物 ， 当 q, 为 负 ， 表 示 需 要 货物 。 问 题 必须 满足 > ,yd, =0 
才能 有 人 和解。 目的 是 找到 一 个 流 ， 将 运输 量 提供 给 需求 方 ， 因 此 这 个 流 必须 符合 容量 。 而 对 于 每 个 顶 
点 v， 输 入 流 与 输出 流 的 差 值 等 于 d,。 在 这 此 条 件 下 ， 我 们 讨论 的 是 “环流 ”而 非 “ 流 ”。 通 过 添 
加 源 点 和 汇 点 ， 同 时 把 源 点 与 所 有 供应 顶点 连接 ， 把 汇 点 与 所 有 需求 顶点 连接 ， 这 一 问题 可 以 很 容 
易 简 化 为 流 问题 。 

另 一 个 变种 问题 把 每 个 顶点 与 流 的 单位 输送 成 本 相关 联 。 例 如 ， 假 设 一 条 弧 e 有 一 个 流 人 = 3 
和 一 个 成 本 w, = 4， 流 在 这 条 弧 上 造成 的 成 本 是 12。 目 的 是 找到 一 条 让 总 成 本 最 低 的 流 。 流 可 以 是 
最 大 流 ， 也 可 以 是 在 运输 问题 中 满足 所 有 条 件 的 流 。 因 此 ， 这 一 问题 又 称 为 最 低 成 本 运输 问题 。 

为 了 解决 问题 ， 仍 可 以 采用 与 Kuhm-Munkres 算法 ( 匈牙利 算法 ) 类 似 的 算法 。 我 们 可 以 从 最 
大 流 开始 ， 然 后 沿 着 负 成 本 环 找到 流 ， 并 扩展 流 。 

























































































9.11 流 和 匹配 之 间 化 简 


在 二 分 最 大 匹配 问题 和 最 大 流 问 题 中 ， 存 在 两 个 有 趣 的 关系 。 


e 从 匹配 到 流 
首先 ， 如 果 你 有 一 个 算法 来 计算 一 个 图 中 的 最 大 流 ， 那 么 你 就 可 以 在 一 个 二 分 图 G(U, V, E) 中 


























计算 最 大 匹配 。 为 此 ， 必 须 建 立 一 个 新 图 GV, E)， 其 顶点 V'=U U V U fs, h 包含 了 两 个 新 顶点 
s 和 1t。 源 点 s 与 U 中 的 所 有 顶点 连接 ， 而 V 中 任何 顶点 与 汇 点 1 连接 。 另 外 ， 每 条 边 (u, v)eE 都 与 





一 条 弧 (u, vyeE' 相关。G' 中 的 所 有 弧 都 只 有 1 个 单位 的 容量 。 
我 们 用 多 个 层 来 表示 这 个 图 。 第 一 层 包含 s， 第 二 层 包 含 U， 第 三 层 包 含 V， 最 后 一 层 包 含 t。 
通过 分 层 ，G ' 中 一 个 值 为 上 的 流 即 为 上 条 穿越 每 个 分 层 且 不 返回 已 经 过 层 的 路 径 。 因 此 ， 由 于 容量 
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是 1 个 单位 的 ， 顶点 ueU 最 多 只 能 被 一 条 路 径 穿 过 ，V 中 其 他 顶点 也 一 样 。 所 以 ， 流 在 2 层 和 3 
层 之 间 经 过 的 边 形 成 了 大 小 为 大 的 匹配 。 
© 从 流 到 匹配 

男 一 方面 ， 如 果 你 有 一 个 算法 能 够 在 一 个 二 分 图 中 计算 出 一 个 最 大 匹配 ， 那 么 当 容 量 为 单位 值 
时 ， 你 也 能 解决 运输 问题 。 设 图 G(V E) A (der 是 一 个 运输 问题 。 

第 一 步 ， 添 加 一 个 源 点 s 和 一 个 汇 点 1。 对 于 所 有 顶点 v， 添 加 max{0, -d,} 条 弧 (s, v) 和 
max{0, d,} AM (v, 0。 得 到 的 结果 是 一 个 图 G'， 在 两 个 顶点 之 间 会 有 多 条 连接 弧 ， 因 此 该 图 称 为 多 
重 图 。 当 且 仅 当 新 的 多 重 图 G' 有 一 个 值 为 A= > aod, KINE s-t 时， 最 初 的 运输 问题 有 解 。 

第 二 步 ， 建 立 一 个 二 分 图 HAV, VE’), EME G' 有 一 个 值 为 A 的 s-t 流 时 满足 完美 匹配 。 





















































对 于 GPA e= (s, v) 形式 表示 的 每 条 弧 ， 生 成 一 个 顶点 ereV*。 对 于 G' 中 以 e = (v, 力 形式 表 
示 的 每 条 弧 ， 生 成 一 个 顶点 ex-eV-。 对 于 G' 其 他 的 弧 e， 生 成 两 个 顶点 e-eV- 和 e*eV*， 并 用 一 条 








边 将 它们 连接 。 另 外 ， 对 于 所 有 弧 e、f， 满 足 e 的 汇 点 与 的 源 点 重合 ， 生 成 一 条 边 (ef). 

考虑 瑟 中 的 一 个 完美 匹配 。 匹 配 中 一 条 格式 为 (e-, e) 的 边 表示 不 存在 穿 过 弧 e 的 流 。 匹 配 中 
一 条 格式 为 (e', f) He 关 f 的 边 表 示 一 条 穿 过 弧 e 然 后 穿 过 弧 了 的 单位 容量 流 。 根 据 这 一 结构 ， 所 
有 连接 源 点 或 汇 点 的 邻接 弧 都 被 流 穿 过 。 匹 配 即 为 一 个 值 为 A 的 s-t 流 (图 9.8)。 











图 9.8 将 单位 容量 的 运输 问题 化 简 为 二 分 最 大 匹配 问题 
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9.12 ” 偏 序 的 宽度 : Dilworth 算法 

















e 定义 
给 定 一 个 偏 序 集 ， 即 一 个 无 环 、 有 向 且 有 传递 性 的 图 G(V, A)。G 中 的 链 是 一 条 有 向 路 径 ， 可 
引申 为 链 是 路 径 覆 盖 的 所 有 项 点“。G 中 的 反 链 是 一 个 顶点 集合 S, 不 存在 (u, vjes, 其 中 (u,v)eA。 














偏 序 的 宽度 指 的 是 最 长 的 反 链 长 度 。 问 题 是 如 何 计算 这 个 宽度 。 

链 和 反 链 之 间 的 重要 关系 由 以 下 定理 给 出 : 

Dilworth 定理 (1950): 设 最 大 反 链 的 大 小 为 5; 把 顶点 拆 分 成 为 链 ， 设 链 的 最 少数 量 为 了 ， 则 
有 a=b。® 

对 于 一 个 反 链 A， 将 它 拆 分 后 的 链 的 集合 为 B。 链 A 与 集合 B 中 的 每 个 链 最 多 仅 交 叉 于 一 个 
顶点 。 但 是 ， 每 个 顶点 veA 必 属 于 B 中 的 一 条 路 径 ， 因 为 B 把 图 分 成 多 个 部 分 。 故 |4| S [Blo 
Dilworth 定理 证 明了 这 两 个 问题 的 极限 值 相等 。 

为 证 明 这 一 点 ， 考 虑 一 个 二 分 图 H(V-, V+, E)， 对 于 每 个 顶点 veV， 存 在 一 个 顶点 veV- H. 
weV+， 而 对 于 每 条 弧 (u, v)eA 存在 边 (w, vsE。 设 M EAH 的 一 个 最 大 匹配 。 根 据 Konig 定理 
( 见 9.1 节 )， 存 在 一 个 顶点 集合 S$， 包含 HH 中 每 条 边 的 至 少 一 个 端点 ， 且 IM| =|5|。 

M 对 应 着 图 G 被 B 中 路 径 拆 分 的 一 个 分 区 ， 它 由 边 (u, v) 组 成 ， 且 满足 osM。 所 有 路 径 
都 结束 于 v， 且 六 在 M 中 是 自由 顶点 ， 因 此 |B) =|Y-|]. 

S 对 应 着 一 个 反 链 A， 它 由 顶点 v 的 集合 组 成 ， 且 满足 S$ PREE v Evo HTH PERA 
至 少 有 一 个 端点 在 S 中 ， 因 而 没有 任何 一 条 弧 的 端点 在 A 中 ,因此 A 是 一 条 反 链 。 

A 的 大 小 至 少 是 |-|S|， 因 此 |4| > |3|。 但 是 ， 由 于 反 链 的 大 小 是 链 拆 分 后 的 分 区 大 小 的 下 限 ， 
由 此 可 知 二 者 相等 。 










































































QO 链 更 常见 的 定义 是 一 个 图 的 顶点 的 子 集 ， 其 中 任意 两 个 元 素 都 可 以 比较 。 一 一 译 者 注 
D 链 的 最 少 划 分 数 等 于 反 链 的 最 长 长 度 。 译 者 注 





130 高 效 算法 : 竞赛 、 应 试 与 提高 必修 128 例 


e SEA OV - IE) 的 算法 
这 个 问题 可 化 简 为 最 大 匹配 问题 (图 9.9 )。 
一 建立 一 个 二 分 图 HV, V*, E), HP v A Vv Æ V 的 副本 ; 当 ( eA 时 ， 有 (u,v )eE。 
一 在 吾 中 计算 一 个 最 大 匹配 M。 
一 计算 U 中 未 匹配 的 顶点 数量 ， 这 既是 G 中 最 大 反 链 的 大 小 ， 也 是 偏 序 G 的 大 小 。 
一 设 G 中 弧 的 集合 D， 且 当 (u, v)eM 时 , 使 得 (u, eD, IA D 是 V 被 拆 分 后 链 数量 最 小 的 


一 部 分 。 
(8) 
2 
Q 











OOO-8 X Yo 





图 9.9 从 左 到 右 : 一 个 偏 序 G; 相关 二 分 图 H; H 中 顶点 S 的 覆盖 用 灰色 表示 ; H 
的 一 个 最 大 匹配 ; G 中 最 大 链 数量 的 拆 分， 相关 反 链 标注 为 灰色 


。 预订 出 租车 
假设 一 家 出 租车 公司 拥有 第 二 天 的 全 部 预约 路 线 。 公 司 必须 在 头 天 夜里 把 车 队 中 的 出 租车 分 配 
给 各 个 预约 ， 并 要 让 出 租车 的 用 量 最 小 化 。 每 个 预约 准确 对 应 着 一 个 确定 的 出 发 时 间 和 出 发 地 点 ， 
并 去 往 另 一 个 地 方 。 假 设 所 有 路 程 的 时 间 都 是 已 知 的 ， 那 么 ， 我 们 可 以 确定 同一 辆 出 租车 是 否 能 在 
完成 预约 1 后 ， 继 续 完成 预约 j。 我 们 用 i 三】 表示 这 种 情况 。 三 关系 是 给 定 预 约 数据 上 的 一 个 全 
序 ， 而 问题 解 就 是 计算 这 个 偏 序 的 大 小 。 
。 推广 
如 果 图 有 权重 ， 我 们 可 以 寻找 一 个 链 的 最 小 拆 分 ， 同 时 ， 这 种 拆 分 让 所 有 弧 的 和 最 小 化 。 这 个 
问题 可 以 化 简 为 在 二 分 图 中 寻找 最 小 成 本 的 完美 匹配 问题 ， 并 可 在 时 间 复杂 度 OU7P) 内 解决 。 
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e 实现 细节 

算法 的 实现 返回 一 个 数组 p， 该 数组 编码 了 最 优 分 区 。p[u] 是 保存 了 顶点 u WBE FER, BEMA 
0 开始 编码 。 函 数 的 输入 收 到 一 个 正方 形 和 矩阵 M， 它 对 每 个 顶点 对 wu 和 vw 标注 了 弧 (u, v) 的 成 本 ; 
当 弧 不 存在 时 ， 成 本 值 为 None。 这 个 实现 假设 所 有 顶点 都 按 拓扑 顺序 排序 过 ， 因 此 ， 如 果 弧 (u, v) 
FE, WAA u<v. 



























































def dilworth (graph): 
n = len (graph) 最 大 割 
match = max bipartite matching (graph) 链 的 分 区 
part = [None] * n 
nb chains = 0 
for v in range(n - 1, -1, -1): 拓扑 逆序 
if part[v] is None: 链 的 开始 
usy 
while u is not None: 跟随 链 前 进 
part[u] = nb chains 标注 
u = match[u] 
nb chains += 1 
return part 





10m H 





树 是 一 种 组 合 数据 结构 ， 当 我 们 考虑 的 对 象 建立 在 数据 结构 之 上 时 ， 树 就 自然 而 然 地 出 现 了 。 





其 中 最 常见 的 考虑 对 象 包括 分 类 、 层 级 关系 、 家 谱 等 。 一 般 来 说 ， 树 结构 需要 




















j 递 归 方式 处 理 ， 算 








法 的 关键 在 于 找到 一 个 好 的 遍历 方法 。 在 这 一 童 中 ， 我 们 会 见 到 很 多 树 的 经 典 问题 。 
正式 来 讲 ， 树 是 一 个 联通 无 环 图 。 树 中 一 个 顶点 可 以 被 指定 为 根 节 点 ， 在 这 种 情况 下 ， 树 称 作 
有 根 树 。 根 节点 给 树 中 的 弧 赋予 了 父子 关系 。 从 一 个 顶点 出 发 并 沿 着 连接 向 上 息 ， 束 能 抵达 根 节 




















我 们 从 一 棵 树 中 轮流 移 除 一 个 叶子 节点 和 一 条 相 邻 边 ; 在 这 个 操作 结束 前 ， 我 们 一 定 会 得 到 一 个 孤 

















基于 树 的 动态 数据 结构 有 很 多 种 ， 如 红 黑 查找 二 又 树 或 线段 树 。 这 些 结构 实现 了 树 的 再 平衡 ， 


以 便 让 操作 能 够 在 对 数 时 间 内 完成 。 相 反 在 编程 欧 赛 问题 中 ,输入 只 给 出 一 次 ， 因 此 有 时 可 以 跳 过 











这 些 操作 ， 直 接 建立 平衡 的 数据 结构 。 























我 们 可 以 用 两 种 方式 来 表达 一 个 基本 树 。 第 一 种 是 经 典 表 示 方 式 ， 即 用 邻接 数组 来 描述 ， 不 区 


分 特定 的 顶点 ， 如 树 的 根 节点 。 另 一 种 常用 表示 方式 是 前 驱 表 方式 : 对 
是 0 )， 除 了 根 节 点 以 外 ， 每 个 顶点 仅 有 一 个 唯一 的 前 驱 节 点 ， 后 者 被 编码 到 























于 一 个 有 根 树 ( 通常 根 节点 


个 表 中 。 根 据 问题 的 


类 型 和 使 用 的 算法 ， 其 中 一 种 表示 方式 会 更 加 匹配 ， 而 一 种 表示 方式 的 树 转换 为 另 一 种 也 可 以 在 线 


性 时 间 复 杂 度 内 完成 。 





def tree prec to adj (prec, root=0): 
n = len(prec) 








graph = [[prec[u]] for u in range(n) ] # 添加 前 驱 节点 

graph[root] = [] 

for u in range(n): # 添加 后 序 节 点 
if u != root: 


graph[prec[u]].append(u) 
return graph 
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def tree adj to _prec(graph, root=0): 
n = len(graph) 











prec = [None] * len(graph) 

prec[root] = root # 标注 ， 为 了 不 重复 访问 根 节 点 
to_visit = [root] 

while to visit: # 深度 优先 遍历 


node = to_visit.pop() 
for neighbor in graph[node]: 
if prec[neighbor] is None: 











prec[neighbor] = node 
to_visit.append (neighbor) 
prec[root] = None # 用 标准 方式 标注 根 节点 























return prec 





10.1 哈 夫 曼 编码 


。 定 义 
一 个 字母 表 的 二 进 制 编码 是 一 个 函数 cs 一 {0,1}*， 且 当 a,be 允 时， 保证 没有 任何 一 个 编码 
的 字符 (a) 是 另 一 个 字符 cb) 的 前 级 。 这 个 编码 把 中 的 每 个 字符 变 成 了 {0,1}* 格式 。 而 前 级 上 的 
特性 可 以 清晰 无 误 地 解码 出 原始 内 容 了 。 一 般 来 说 , 我 们 希望 编码 尽 可 能 地 短 。 正 式 地 说 , 给 定 一 个 
频率 函数 扩 史 一 R'?， 我 们 寻找 一 个 编码 方式 让 以 下 式 子 最 小 ， 以 便 最 小 化 成 本 : 
了 /Ole 


aed, 




















e BREA O(n log n) 的 算法 

HP n 是 字母 表 的 大 小 。 哈 夫 曼 编码 可 以 被 视 为 一 棵 二 又 树 ， 其 叶子 节点 是 字母 表 的 每 个 字 
母 ， 而 每 个 节点 用 以 该 节点 为 根 节点 的 子 树 的 叶子 节点 的 字符 使 用 频率 来 标注 。 为 了 建立 这 棵 二 又 
树 ， 我 们 从 一 个 和 森林 开始 ， 其 中 每 个 字母 是 一 个 单 节点 树 ， 并 以 其 使 用 频率 标注 。 然 后 ， 当 有 多 棵 
树 时 ， 我 们 把 两 个 频率 最 低 的 树 汇总 在 一 起 ， 再 把 这 个 新 根 节点 用 两 棵 子 树 的 使 用 频率 之 和 来 标注 
(图 10.1 )。 通 过 参数 交换 ， 我 们 可 以 证 明 这 样 生 成 的 编码 是 最 优 的 。 

为 了 能 | 我 们 把 它 放 置 在 一 个 能 有 效 添加 元 素 和 删除 最 小 元 素 的 数据 结 
FA o BEWARE 5 PR RER ARR BATT BE HEE SE BL 
在 Python " 这 一 结构 在 heapq 模块 中 。 

存储 在 优先 级 队列 中 的 元 素 是 元 组 (人 A)， 其 中 A 是 一 棵 二 又 树 ，f 是 存储 在 A 中 的 所 有 字符 
的 使 用 频率 之 和 。 一 棵 树 以 两 种 方式 来 编码 。 一 个 字符 a 表示 只 有 一 个 叶子 节点 ( 和 根 节点 ) 的 一 
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O 这 里 的 编码 格式 用 正则 表达 式 来 理解 ，{0, 1}* 即 为 包含 且 只 包含 多 个 或 0 个 0 和 1 字符 的 一 个 字符 
串 ， 也 就 是 二 进 制 编码 。 译 者 注 





134 | 高 效 算法 : 竞赛 、 应 试 与 提高 必修 128 例 


zB 


输入 频率 ”输出 编码 








Iaw uawa 
= R S 





G 


10.1 建立 一 个 哈 夫 曼 编 码 。 每 个 节点 被 以 其 为 根 节点 的 子 树 的 所 有 了 叶子 节点 的 使 用 频 
率 之 和 标注 。 在 最 下 方 ， 两 个 不 同 的 输入 产生 了 两 个 不 同 的 哈 夫 曼 编 码 


S108 树 | 135 





棵 树 。 由 左 子 树 1 和 右 子 树 + 组 成 的 一 棵 树 用 元 组 (1, 1) 表示 ， 且 它 必 须 是 一 个 列表 ”以 避免 重复 。 


def huffman (freq): 
h= [] 
for a in freq: 
heappush(h, (freq[a], a)) 
while len(h) > 1: 
(£l, 1) = heappop (h) 
(fr, r) = heappop (h) 
heappush(h, (fl + fr, [l, r])) 
code = {} 
extract (code, h[0] [1]) 
return code 








def extract (code, tree, prefix=""): 
if isinstance(tree, list): 
1, r= tree 
extract (code, l, prefix + "0") 
extract (code, r, prefix + "1") 
else: 
code[tree] = prefix 











10.2 ”最近 的 共同 祖先 


> 


(A) 


~ /™. 
WAN /N /\. 








EBM n SI, Fea Ee eT] Pe PA A. 对 于 两 给 定 顶 点 All v, 
找到 它们 在 树 中 最 近 的 共同 祖先 (lowest common ancestor， 简 称 LCA ). ee u' 把 u 和 








© ”必须 是 无 重复 元 素 的 列表 。 译 者 注 


136 | 高 效 算法 : 竞赛 、 应 试 与 提高 必修 128 例 





v 保 存在 wu 的 子 树 中 ， 而 且 没 有 任何 ww 的 直接 后 序 节 点 有 该 属性 
e 每 次 查询 复杂 度 为 O(logn) 的 结构 








思路 是 为 每 个 节点 二 添加 一 个 层级 信息 和 指向 其 祖先 的 引用 





Hy 


， > 


P anc[k, u] Æ u 的 一 个 级 别 为 





level[u]-2* 的 祖先 节点 值 ( 如 果 祖 先 节 点 存在 ); 否则 该 值 是 -1。 因 此 ， 我们 可 以 用 这 些 “ 指 针 ” 


快速 追溯 祖先 节点 的 位 置 。 





考虑 查询 LCA(u, v), Bl “HE u 和 vw 的 最 近 祖 先 ?” 在 不 失 普 适 性 的 前 提 下 ， 我 们 假设 





level[u] < level[v]。 首 先 要 选择 与 








在 同一 层级 的 v 的 祖先 。 然 后 对 每 个 从 logn 到 0 迭代 ， 如 果 





anc[k, u] 关 anc[k, v]， 那 么 








Ju 和 vw 的 祖先 节点 anc[k, u] 和 anc[k, u) RAMEN. MAYu =v 时， 


我 们 找到 了 它们 的 共同 祖先 。 
。 实现 细节 

我 们 假设 树 以 一 个 数组 prec 的 形式 给 出 ， 其 
表示 父 节点 。 当 父 节点 下 标 比 子 节点 下 标 小 1， 且 根 节点 是 0 时 ， 以 上 假设 成 立 。 











中 对 于 每 棵 树 的 节点 we {0, 1,…, n-1}, H. prec[u] 








class LowestCommonAncestorShortcuts: 








def init (self, prec): 
n = len(prec) 
self.level = [None] * n # 建立 层级 
self.level[0] = 0 


for u in range(1, n): 
self.level[u] 1 + self.level[prec[u] ] 
depth log2ceil (max (self.level[u] 
self.anc [10] * ñ. for 
for u in range(n): 
self.anc[0] [u] prec[u] 
for k in range(1, depth): 
for u in range(n): 
self.anc[k] [u] 


for u in range(n))) + 1 


_ in range (depth) ] 


self.anc[k - 1][self.anc[k - 1] [u]] 


def query(self, u, v): 
+ -- Bis v ENPA u 高 


if self.level[u] > self.levelf[v]: 








u, v= vV, 


u 
# -- 让 v 与 wx 在 同 级 








depth = len(self.anc) 
for k in range(depth -1, -1, -1): 
if self.level[u] <= self.level[v] - (1 << k): 
v = self.anc[k] [v] 
assert self.level[u] == self.level[v] 
if u == v: 
return u 
# -- 升 至 最 近 的 共同 祖先 
for k in range (depth -1, -1, -1): 
if self.anc[k][u] != self.anc[k] [v]: 
u = self.anc[k] [u] 
v = self.anc[k] [v] 
assert self.anc[0][u] == self.anc[0] [v] 
return self.anc[0] [u] 
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e 在 一 个 区 间 内 取 最 小 值 的 替代 方案 

考虑 一 个 对 树 的 深度 优先 遍历 ， 如 图 10.2 所 示 。 为 简化 起 见 ， 假 设 所 有 顶点 使 用 以 下 编号 方 
式 : 所 有 顶点 的 编号 都 大 于 其 父 节 点 的 编号 。 我 们 在 一 个 数组 t 中 记录 这 个 遍历 过 程 ， 在 第 一 次 和 
最 后 一 次 过 到 顶点 uw， 以 及 在 每 次 向 下 朝子 节点 递归 时 ， 都 记录 这 一 顶点 。 我 们 用 flu] 来 记录 处 理 
顶点 2 的 结束 时 间 。 现 在 ， 数组 t 在 flu] A flv] 之 间 包 含 了 所 有 在 wu 和 v 之 间 遍 历 的 中 间 节 点 。 这 
个 区 间 中 的 最 小 顶点 就 是 wu 和 vw 的 最 低层 祖先 。 因 此 ， 只 需 在 线性 时 间 内 生成 对 树 的 深度 优先 遍历 
数组 (+， 并 使 用 一 个 分 段 树 来 回复 查询 即 可 ( 见 4.5 节 )。 建 立 这 一 结构 需要 的 时 间 是 O(nlogn), 一 
次 查询 的 时 间 复 杂 度 是 O(logn)。 















































o 实现 细节 

算法 实现 用 邻接 列表 的 方式 接收 输入 的 图 ， 而 且 不 假设 各 顶点 的 编号 方式 。 因 此 , afs 
trace 记录 不 仅 包含 顶点 ， 也 包含 元 组 (深度 和 顶点 )。 由 于 输入 有 可 能 很 大 ， 深 度 优先 遍历 通过 
一 个 栈 to visit 来 递归 地 实现 。 数 组 next 表示 对 于 每 个 顶点 ， 有 多 少 个 后 序 节点 已 被 遍历 过 。 
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图 10.2 把 最 低层 级 共同 祖先 问题 简化 为 在 深度 优先 遍历 过 程 中 的 区 间 最 小 值 问题 





class LowestCommonAncestorRMQ: 
def init (self, graph): 

n = len(graph) 

dfs: trace = [] 
self.last = [None] * n 


to visit = [(0, 0, None)] # 顶点 0 是 树 的 根 节点 
next = [0] * n 


while to_visit: 
level, node, father = to _visit[-1] 
self.last[node] = len(dfs_ trace) 
dfs_trace.append((level, node) ) 
if next[node] < len(graph[node]) and \ 
graph[node] [next[node]] == father: 
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next[node] += 1 
if next[node] == len(graph[node]): 
to_visit.pop() 
else: 
neighbor = graph[node] [next[node] ] 
next[node] += 1 
to_visit.append((level + 1, neighbor, node) ) 
self.rmq = RangeMinQuery(dfs_ trace, (float('inf'), None) ) 
def query(self, u, v): 
lu = self.last[u] 
lv = self.last[v] 
if lù > Iy: 
lu, lv = lv, lu 
return self.rmq.range_min (lu, lv + 1) [1] 
e 变种 
使 用 这 个 数据 结构 ， 我 们 还 可 以 确定 树 中 两 个 节点 之 间 的 距离 ， 因 为 通过 最 近 共 同 祖先 的 路 径 
一 定 最 短 。 


10.3 ” 树 中 的 最 长 路 径 


定义 : 给 定 一 棵 树 ， 寻 找 树 中 的 最 长 路 径 。 
复杂 度 : 线性 


e 使 用 动态 规划 的 算法 





o 

















和 很 多 与 树 相 关 的 问题 一 样 ， 我 们 可 以 使 用 归纳 子 树 的 动态 规划 算法 。 固 定 一 个 根 节点 ， 以 便 
把 树 中 的 边 转向 。 

对 于 每 个 顶点 v， 我 们 考虑 一 个 以 * 为 根 节 点 的 子 树 。 用 b[v] 来 记录 该 子 树 中 以 v 为 终点 的 最 
KE, H t[v] 来 记录 子 树 中 没有 限制 条 件 的 最 长 路 径 长 度 。 我 们 也 把 biv] 称 作 “以 * 为 根 节 点 的 
子 树 的 深度 ”。 

WR v REFER, M b[y]=tv]=0。 否 则 有 以 下 关系 : 

b[v] = 1 + max b[u] XIF v PRTI u 

t[v] = max {max ¢[u,], max b[u,] +2 + b[u,]} 对 于 vv 节点 的 子 节点 wu All uw, 





程序 可 以 不 必 使 用 -1 作为 默认 值 来 测试 子 节 点 数量 。 注 意 ， 
两 个 子 节 点 ， 而 对 节点 的 子 节 点 进行 排序 。 
o 陷阱 

如 果树 中 有 数 百 万 个 顶点 ， 由 于 调 



































j 栈 的 大 小 限制 "， 使 








© 在 Linux 系统 下 使 用 ulimit -a 命令 可 以 看 到 系统 对 栈 的 数量 限制 。 


HURN TIRE b 值 最 大 化 的 





J Python 进行 深度 优先 遍历 是 无 法 实 





译 者 注 
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现 算法 的 。 因 此 ， 需 要 使 用 一 个 显 式 的 栈 "。 
o 测试 
设 一 棵 树 中 的 随机 顶点 x 和 一 个 与 7 距离 最 远 的 顶点 u， 于 是 在 边界 树 u 中 存在 一 条 最 长 路 径 。 
为 了 证 明 这 一 点 ， 设 一 条 端点 为 内 M v 的 最 长 路 径 , 在 从 + 到 4 的 路 径 上 有 顶点 w， 从 vi 到 vw 的 
路 径 上 有 顶点 v'， 使 得 w' 和 v' 的 距离 最 小 。 如 果 这 两 条 路 径 相 交 ， 我 们 可 以 在 u' 和 v' 的 连接 线 中 
选择 一 个 随机 顶点 (图 10.3 )。 
我 们 用 d 来 记录 树 中 的 距离 。 对 于 wu， 我 们 有 : 
d(u',u) > d(u'v') + d(v', v,) 
由 于 vi 到 vw, 路径 是 最 优 的 ,我们 有 : 
d(v,,v') = d(v',u’) +d(u’,u) 


这 使 得 du’, v) =0 Adv, v) =d, u) KE, MA v 2) u 的 路 径 同 样 也 是 树 中 一 条 最 长 路 径 。 


























图 10.3 替换 一 个 参数 ， 证 明 当 w 是 + 的 一 个 距离 最 远 顶 点 时 ， 存 
在 一 条 从 zx 出 发 的 最 长 路 径 ” 


e 深度 优先 算法 
上 述 测试 暗示 存在 一 个 替代 算法 。 通 过 深度 优先 遍历 ， 可 以 确定 一 个 给 定 顶 点 的 最 远 距 离 顶 





























点 。 因 此 ， 我 们 可 以 选择 一 个 随机 顶点 r+， 确定 一 个 距离 x 最 远 的 顶点 v,， 然 后 重新 确定 一 个 距离 
vi 最 远 的 顶点 vao A vi 到 vw 的 路 径 就 是 最 长 路 径 。 

© 自己 用 程序 去 实现 一 个 栈 ， 而 不 是 系统 提供 的 栈 。 译 者 注 

@ 因为 从 rr 到 的 距离 最 远 ， 因 此 在 从 + 到 wu 一样 的 情况 下 ,，u' 一 Vv' 一 Vv 的 距离 一 定 小 于 wu’ 一 的 距离 。 





译 者 注 
前 面条 件 假 设 的 存在 一 条 端点 为 v, n 的 最 长 路 径 。 一 一 译 者 注 

记录 du, u') =a, d(u', v') = b, dv, v) =c, RWAN a>b+c[1], H cb+a[2]， 那 么 把 [1] 中 的 c 
替换 掉 ， 得 到 4 三 bp+b+a， 从 而 发 现 bp=0, 把 4=0 代 入 [1] 和 [2] HSI a>c 和 c 宇 a， 从 而 得 到 


译 者 注 
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e 变种 

我 们 希望 在 树 中 删 掉 尽 可 能 少 的 边 ， 使 得 由 此 产生 的 树 中 不 存在 长 度 超过 RR 的 路 径 。 为 此 ， 只 
需 在 执行 上 述 动态 规划 方法 时 ， 删 掉 确 定 下 来 的 关键 边 即 可 。 

考虑 顺序 处 理 顶点 v 及 其 子 节点 usu, 使 得 blu] SS bluio H blu! 之 及 或 如 站]+2+b[z] > R 
时 ， 删 除 边 (v, uy)， 然 后 减 小 4， 并 重新 开始 测试 。 




















pom 








10.4 ”最 小 权重 生成 树 : Kruskal 算法 


° 定义 

给 定 一 个 无 向 连通 图 ， 我 们 希望 找到 一 个 边 的 集合 ， 使 得 所 有 顶点 对 能 通过 这 些 边 连接 起 来 。 
边 的 权重 为 正 值 ， 而 我 们 想 找 的 是 权重 和 最 小 的 边 的 集合 。 注 意 ， 在 一 个 环 中 删除 一 条 边 仍 能 保留 
连通 性 ， 所 以 这 种 集合 是 无 环 的 ， 它 是 一 棵 树 一 一 我 们 寻找 的 是 一 棵 最 小 权重 生成 树 〈 图 10.4 )。 


e 应 用 
图 中 的 边 带 着 权重 (或 成 本 ) w， 我 们 要 用 最 少 的 成 本 来 添加 边 ， 最 终 让 图 连通 ， 因 此 需要 一 
个 集合 A c E, 使 得 G(V, A) HH, HD... We) HB). 


e SHEA O(lEllogiEl) 的 算法 

Kruskal 算法 使 用 穷 举 法 来 解决 问题 ， 按 照 权 重 升 序 来 遍历 所 有 边 (u, v)， 并 在 它们 不 能 形成 一 
个 环 的 时 候选 择 每 条 边 (u, v)。 算 法 的 最 优 性 通过 参数 替换 来 证 明 。 对 于 算法 生成 的 解答 A 和 一 个 
任意 解答 B， 假 设 算法 选择 的 第 一 条 边 为 e， 且 它 不 在 B 集合 中 , 那么 B U {ec} 包含 着 一 个 环 C。 
通过 选择 e， 环 C 中 所 有 边 都 有 至 少 和 e 一 样 大 的 权重 。 因 此 , 用 B 中 的 。 替 换 其 中 一 条 边 就 能 保 
AB 的 连通 性 。 这 样 做 不 增加 成 本 ,仅仅 减少 了 A 到 B 之 间 的 距离 "。 选 择 B 作为 越 来 越 接近 A 的 
最 优 解 ， 可 以 反 证 A 就 是 最 优 解 。 



























































































































































图 10.4 有 256 个 顶点 的 完全 图 中 的 最 小 权重 生成 树 ， 每 条 边 的 权 
重 是 它 到 其 端点 的 欧 氏 距离 





D 例如 A 与 B 之 间 的 距离 ， 我们 选择 |4\B|+|B\4|。 
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为 了 能 按照 权重 升序 遍历 所 有 边 ， 我 们 要 新 建 一 个 包含 权重 和 边 的 数据 对 列表 。 列 表 根据 数据 
对 的 字典 序 排序 ， 并 被 遍历 。 为 了 维护 森林 ， 并 能 高 效 地 检测 加 入 一 条 新 边 后 能 否 构成 环 ， 我 们 使 











用 一 个 并 查 集 结构 ( 见 1.5.5 节 )。 











def kruskal(graph, weight): 
uf = UnionFind (len (graph) ) 
edges = [] 
for u in range(len(graph) ): 
for v in graph[u]: 
edges.append((weight[u][v], u, v)) 
edges.sort () 
mst = [] 
for w, u, v in edges: 
if uf.union(u, v): 
mst.append((u, v) ) 
return mst 











© Prim 算法 








问题 有 另外 一 种 算法 解法 ， 即 Prim 算法 ， 其 运行 方式 和 Dijkstra 算法 类 似 。Prim 算法 为 一 个 
顶点 集合 S 维护 一 个 优先 级 队列 Q， 其 中 包含 着 所 有 离开 S 的 边 。 刚 开始 ，S 包含 唯一 一 个 随机 顶 
点 u; 然后 ， 只 要 $ 没有 包含 所 有 顶点 ,就 从 Q 中 取出 一 条 权重 最 小 的 边 (w v), WE ues Hv g ss 














TUR u 被 加 入 S 中 ，Q 被 更 新 。Prim 算法 的 复杂 度 也 是 O(|Ellog|2|)。 


$11% 


At 
Ob 





本 章 补充 了 序列 的 相关 算法 。 其 实 ， 动 态 规划 思想 还 能 解决 更 多 问题 ， 就 让 我 们 从 两 个 经 典 问 
题 开 始 ， 即 背包 问题 和 找 零 问题 。 


11.1 背包 问题 


e 定义 

给 定 n PAREN pott, pi 的 对 象 ， 其 各 自 对 应 的 值 为 w…, w+， 另 设 一 个 整数 C 作为 背包 的 
容量 。 我 们 希望 知道 如 何 得 到 一 个 对 象 值 总 和 最 大 的 子 集 ， 同 时 权重 和 不 超过 C。 这 是 一 个 NP 复 
杂 问 题 。 


e 关键 测试 

针对 ie {0,…, n-1} 和 ce{0,…, C}， 我 们 记 可 得 的 最 大 值 为 Opt[i][c]， 其 中 下 标 为 0 到 i 的 对 象 权 
重 和 不 超过 c (图 11.1 )。 对 于 基本 情况 i= 0， 当 po sc 时, 我 们 有 Opt[0][c] = 0, AI Opt[0][c] = 
vi。 对 于 i 取 更 大 值 ， 即 i = 1,…, n-1 的 情况 ， 当 对 象 下 标 为 i 时 ， 最 多 有 两 种 选择 要么 选择 它 ， 
要 么 不 选择 它 。 在 第 一 种 情况 下， 容量 会 减少 p,， 因 此 有 如 下 关系 : 
Opt[fi 一 1][c 一 p,]+v， 在 c>c 时 ， 取 这 个 对 象 的 情况 
Opt-1]j[e] 不 取 这 个 对 象 的 情况 











Opt[i][c] = ml 


第 11 章 集合 | 143 


























图 11.1 一 个 Opt 表 的 展示 。 计 算 每 个 格子 最 多 需要 之 前 两 个 格子 ， 其 中 包括 一 个 位 
于 正 上 方 的 格子 。 网 格 中 的 最 长 路 径 是 问题 的 一 个 特殊 情况 ，3.1 节 有 介绍 


e SHEA Onc) 的 算法 

我 们 把 有 这 种 复杂 度 称 作 伪 多 项 式 复杂 度 。 动 态 规划 方法 在 维护 矩阵 Opt 时， 也 要 维护 一 个 布 
尔 型 矩阵 Sel。 后 者 记录 下 最 终 取 得 写 入 Opt 的 值 的 那 一 个 选择 。 一 旦 这 些 和 矩阵 依据 上 述 递归 方程 
被 填 满 ， 对 元 素 进行 一 次 反 向 遍历 ， 就 能 从 Sel 矩阵 中 找到 取得 最 优 解 的 元 素 集合 。 


def knapsack(p, v, cmax): 
n = len(p) 




















Opt = [[0] * (cmax + 1) for _ in range(n + 1)] 
Sel = [[False] * (cmax + 1) for in range(n + 1)] 
# -- 基本 情况 


for cap in range(p[0], cmax + 1): 

Opt [0] [cap] = v[0] 

Sel[0] [cap] = True 
+ -- 归纳 法 
for i in range(1, n): 

for cap in range(cmax + 1): 

if cap >= p[i] and Opt[i-1] [cap - p[i]] + v[i] > Opt[i-1] [cap]: 
Opt [i] [cap] = Opt[i-l][cap = p[i] + vfil] 





Sel[i] [cap] = True 
else: 
Opt [i] [cap] = Opt[i-1] [cap] 
Sel[i] [cap] = False 
# -- 输出 结果 
cap = cmax 
sol = [] 
for i in range(n-1, -1, -1): 


if Sel[i] [cap]: 
sol.append (i) 

cap == plil 

return (Opt[n - 1] [cmax], sol) 














11.2 FHA 


现在 ， 我 们 希望 用 面额 为 x0，…, x 分 的 硬币 或 钞票 来 获取 一 个 值 R。 问 题 在 于 确定 是 否 存在 
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EMA, REHE xo x, 4， 其 总 和 为 R。 你 或 许 会 觉得 可 笑 , 但 是 缅甸 就 曾经 使 用 面额 为 15、 
25、35、45、75 和 90 缅 元 (kyat) 的 钞票 (图 11.2 )。 
为 了 解决 问题 ,一 个 值 x; 可 被 多 次 用 来 获得 一 个 总 和 值 。 





def coin change (x, R): 
b= [False] * (R + 1) 
b[0] = True 
for xi in x: 
for s in range(xi, R + 1): 
b[s] |= b[s = xi] 
return b[R] 











e 变种 
如 果 存 在 一 个 解决 方案 ， 那 我 们 就 可 以 尝试 用 最 少数 量 的 硬币 或 钞票 解决 问题 。 
e 测试 





只 需 按照 货币 面额 降序 计算 ， 并 随时 保证 后 续 选 择 的 面额 不 超过 剩余 额度 。 
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11.2 一 张 45 缅 元 的 旧 钞 票 

在 欧元 货币 系统 中 ， 我 们 可 以 实现 一 个 最 小 数量 的 货币 组 合 。 但 是 ， 假 如 货币 面额 体系 为 1、 
3、4 和 10， 而 我 们 和 希望 得 到 总 和 为 6。 这 个 贪 梦 算 法 得 到 的 最 终结 果 是 3 个 硬币 的 4+1+1 组 合 ， 
而 不 是 最 优 解 3+3 组 合 。 
e 复杂 度 为 O(nR) 的 算法 

假设 货币 面额 是 x0,…, x;,， 而 需要 的 总 额 是 0 Sm SR, W Aim] 是 所 需 货币 数量 最 少 的 
最 终 方案 ; 当 没 有 结果 的 时 候 ，A[i[m] = oo。 我 们 可 以 派生 出 一 个 与 背包 问题 类 似 的 递归 关系 : 
对 于 所 有 额度 m， 当 x 能 把 m 整除 时 ，A[0][m] 的 值 是 m/x。， 否 则 值 是 co。 当 i = 1,…, n-1 时 ， 
有 如 下 关系 : 























Alil[m—-x,]+1 ” 当 mx 时 ， 选 择 这 一 硬币 的 情况 


Afi[m] = 
Lim] max{ diii 不 选择 这 一 硬币 的 情况 





11.3 ”给 定 总 和 值 的 子 集 
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输入 


e 定义 


n NERZ xo, x,,1!， 我 们 希望 知道 是 


NP 复杂 问题 。 


e 复杂 度 为 O(nR) 的 算法 


否 存在 一 个 整数 和 等 于 给 

















EIER 的 子 集 。 这 是 一 个 








维护 一 个 布尔 型 数组 ， 对 于 每 个 下 标 i 和 总 和 0 三 s 三 R， 数 组 代表 是 否 存 在 一 个 由 整数 xo 











Xx"…,X; 组 成 的 子 集 ， 其 总 和 等 于 so 

















起 初 ， 对 于 一 个 空 集合 ， 这 一 数组 仅 在 下 标 等 于 0 的 位 置 是 true。 然 后 ， 对 于 每 个 ie {0,…， 





n-1} 和 所 有 se{0,…, R}， 当 且 仅 当 存在 一 个 总 和 为 8 或 -xz; IF x, 





Xot 生成 一 个 总 和 为 s 的 子 集 。 
注意 代码 实现 中 s 上 的 循环 执行 顺序 。 








, Xi 时， 我 们 才能 用 整数 





def subset sum(x, R): 
b= [False] * (R + 1) 
b[0] = True 
for xi in x: 


bis] |= bis = xi] 
return b[R] 





for s in range(R, xi - 1, -1): 








e 复杂 度 为 O(2ma) 的 算法 





当 R 很 大 而 n 很 小 时 ， 这 个 算法 会 很 有 趣 。 我 们 把 输入 X= {x0…, xz 切 分 成 两 个 不 相交 的 部 
Se rb E 我 们 建立 一 个 集合 
= SA。 和 集合 Z = R - S。， 两 者 包含 着 R - v 数值 对 ， 其 中 v 描述 了 Ss,。 我 们 只 需 测 试 Y 和 Z 是 























ane 


$ 
fo} 











def part _sum(x, i=0): 
if i == len(x): 
yield 0 
else: 
for s in part_sum(x, i + 1): 
yield s 
yield s + x[i] 





def subset _sum(x, R): 
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k = len(x) // 2 # 切 分 输入 
Y = [v for v in part sum(x[:k])] 
Z= [R - v for v in part_sum(x[k:]) ] 
Y.sort () # 测试 Y Foz 的 交集 
Z.sort () 
i= 0 
3 = 0 
while i < len(Y) and j < len(Z): 
if Y[i] == Z[j]: 
return True 
elif Y[i] < Z[j]: # 增 大 最 小 元 素 的 下 标 
i += 1 
else: 
j += 1 
return False 











e 变种 : 拆 分 成 两 个 尽 可 能 平衡 的 子 集 








给 定 x0…, x,1， 需 要 生成 S S {0,…,n-1} ,使 得 








11.4 大 个 整数 之 和 


e 定义 


六 一 > es% 
算法 复杂 度 为 O(n > xz)。 如 同 处 理 部 分 总 和 一 样 ， 然 后 在 布尔 型 数组 b 中 寻找 一 个 下 标 s， 使 
得 bis] X true 且 最 接近 》 xy/2。 然 后 对 于 所 有 a = 0, 1, 2… 和 d= 


尽 可 能 小 。 











+1, -1， 考 虑 b[ x/2 + a d] 





给 定 n 个 整数 x0…, xz， 我 们 和 希望 知道 能 和 否 从 中 取出 大 个 数 ， 使 其 总 和 为 0。 


e 应 用 

















对 于 上 = 3， 这 一 问题 在 离散 几何 中 非常 重要 ， 很 多 经 典 问题 都 能 化 简 为 求 3 个 整数 和 的 问题 。 











例如 ， 给 定 个 三 角形 ， 想 知道 它们 能 否 完整 覆盖 男 一 个 给 定 三 角形 。 或 者 给 定 n 个 点 ， 想 知道 是 

















否 存在 
该 方法 是 最 优 的 。 当 下 值 更 大 时 ， 问 题 在 密码 学 中 有 着 重要 的 应 


o BREA O(n") 的 算法 

















条 直线 通过 其 中 至 少 3 个 点 。 对 于 这 类 问题 ， 存 在 一 个 复杂 度 为 Om) 的 算法 ， 我 们 推测 











价值 。 














首先 测试 上 = 2 的 情况 。 只 需 测试 是 否 存在 关 j 且 x;= -x)。 如 果 x 是 已 排序 的 ,使 用 一 次 双向 
遍历 ( 如 同 合并 两 个 有 序列 表 ) 就 能 解决 问题 ( 见 4.1 节 ) 和 否则， 可 以 把 输入 参数 存 入 一 个 散 列 








表 ， 然 后 当 -x; 存在 于 表 中 时 ， 在 表 中 查找 x。 





对 于 k= 3 的 情况 ,我 们 建议 使 用 一 个 复杂 度 为 0(m?) 的 算法 。 从 给 x 排序 开始 ; 然后 对 每 个 x 

















只 需 测试 列表 x+x; 和 -x HEATH 


上 有 

















个 公共 元 素 ， 因 为 这 个 元 素 的 格式 一 定 是 xitxj 和 -x HEP x; + 


+ 汶 ==0。 这 一 方法 在 大 值 更 大 时 能 够 进一步 推广 ， 但 性 能 不 如 以 下 这 种 算法 。 


e FREH O(n") 的 算法 
通过 求 得 k/2 个 输入 整数 元 素 之 和 ， 我 们 建立 一 个 给 定 整数 的 多 重 集 A"。 同 样 ， 通 过 求 得 必 2 
个 输入 整数 元 素 之 和 ， 建 立 一 个 多 重 集 B。 

现在 ， 只 需 测试 集合 A 和 R-B 是 否 有 一 个 非 空 交集 。 为 了 实现 这 一 点 ,我 们 把 A M B 排序 ， 
然后 像 合 并 两 个 有 序列 表 一 样 ， 在 两 个 列表 上 执行 一 次 联合 遍历 。 算 法 复杂 度 是 On), 





























° 实现 细节 
为 避免 多 次 取 到 同一 个 下 标 ， 我 们 在 A 和 B 中 不 仅 存 储 总 和 ， 也 存储 由 各 个 总 和 以 及 得 到 该 
总 和 的 元 素 下 标 组 成 的 数值 对 。 因 此 ， 人 针对 A 和 B 中 每 个 数值 对 ， 我 们 可 以 确定 下 标 是 否 相 交 。 











DQ 在 多 重 集中 ， 同 一 个 元 素 可 以 出 现 多 次 。 译 者 注 





第 12 章 AMEE 


几何 问题 的 核心 元 素 是 点 。 点 表示 空间 中 的 一 个 位 置 。 本 章 介绍 了 很 多 与 图 上 点 相关 的 经 典 
问题 。 
自然 ， 我 们 会 用 坐标 值 对 来 表示 点 。 另 一 个 重要 的 基本 操作 就 是 测试 方向 (图 12.1 )。 给 定 三 
个 点 a、b 和 <c， 我 们 和 希望 知道 这 三 个 点 是 否 排 在 一 条 直线 上 ， 或 者 是 否 有 一 条 a b> c 的 前 进 路 
线 ， 实 现 左 转 或 右 转 。 





























a 


12.1 输入 测试 方法 left_turn(a,b,c) 会 返回 true 





def left turn(a b, c): 
return(a[0] = c[0]) * (b[1] = e[t) = (af1] = c[1]) * (b[0] = c[0]) > 0 














当 点 坐标 不 是 整数 时 ， 我 们 建议 为 了 避免 侈 人 误差 ， 不 要 与 0 LR, TE PE ET 
比较 ， 如 10-7. 
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12.1 Sane 











° 定义 
给 定 一 个 有 nn 个 点 的 集合 ,希望 基于 这 些 点 的 一 个 子 集 建立 一 个 凸 多 边 形 ， 把 剩余 的 点 包含 在 
多 边 形 内 。 问 题 的 解 也 是 包含 所 有 点 且 周 长 最 小 的 多 边 形 。 


e 复杂 度 的 下 限 

通常 情况 下 , 不 可 能 在 时 间 o(nlogn) 内 解决 凸 包 问 题 "。 为 了 证 明 这 一 点 , 我 们 设 一 个 及 个 数 
字 的 序列 at, dro 点 (i, ap (an Gy?) 的 凸 包 计算 的 返回 顺序 与 数字 +, a 的 排序 相关 。 因 此 ， 
如 果 我 们 能 在 o(nlogn) 次 操作 内 计算 完毕 ， 就 会 得 到 一 个 有 同样 复杂 度 的 排序 算法 。 


e SEA O(nlogn) 的 算法 
解决 这 个 问题 一 般 采用 Graham 扫描 算法 。 但 我 们 要 介绍 一 个 变种 一 一 Andrew 算法 ， 它 不 会 围 
绕 着 一 个 参考 点 去 计算 其 周围 点 的 角度 ， 而 是 计算 它们 的 x 坐标 。 这 一 算法 的 好 处 在 于 不 需要 进行 
角度 计算 。 角 度 计 算 经 常 带 来 精度 差错 。 
我 们 仅 介绍 如 何 获 取 凸 包 的 上 部 分 。 集 合 中 的 点 会 按照 其 x 坐标 升序 来 遍历 ， 在 一 个 top 中 ， 
我 们 维护 已 被 处 理 过 的 凸 包 的 点 。 把 每 个 新 的 点 p IA top; 当 倒 数 第 二 个 点 进入 top 使 序列 不 
再 是 凸 多 边 形 的 时 候 ， 该 点 就 会 被 移 除 。 


o 实现 细节 

凸 包 的 下 部 分 bot 使 用 相同 方式 来 获取 。 结 果 是 把 top 列表 反 转 ， 获 得 正确 的 凸 包 点 顺序 ， 
即 得 到 逆 时 针 排 序 后 的 两 个 列表 的 拼接 。 注 意 ， 两 个 列表 的 第 一 个 元 素 和 最 后 一 个 元 素 相 同 ， 所 以 
拼接 结果 中 会 出 现 重复 ， 因 此 去 掉 一 个 多 余 的 点 非常 重要 。 

为 了 简化 代码 ， 我 们 仅 在 删除 了 令 序 列 不 能 形成 是 多边 形 的 元 素 后 ， 再 将 点 p 添加 入 列表 top 
和 bot。 
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def andrew ( 
S.sort ( 
top = [ 
bot = [] 
for p in S: 
while len(top) 
top .pop () 
top.append (p) 
while len (bot) 
bot.pop () 
bot.append (p) 


S): 
) 
] 





return bot[:-1] + top[:0:-1] 


>= 2 and not left _turn(p, top[-1], top[-2]): 


>= 2 and not left _turn(bot[-2], bot[-1], p)? 








12.2 多边形 的 测量 


给 定 一 个 简单 多 边 形 p, 格式 为 n 个 顺序 正常 ”的 点 的 列表 形式 ,我 们 可 以 执行 多 个 测量 (图 


12.2). 


12.2 


o 在 线性 时 间 内 计算 面积 


















































边缘 上 点 ( 黑色 ) 的 数量 是 4， 内 部 整数 坐标 点 ( 白色 ) 也 
是 4 人 个， 多边形 面积 是 4+4/2-1=5 


我 们 可 以 使 用 以 下 公式 计算 A 的 面积 : 








n-l 


1 
A= 2 2 iin = XY) 
i=0 


其 中 下 标 i+] 被 除 以 n 取 模 。 第 i 个 元 素 代表 了 三 角形 (0, pr Pa 带 符号 的 面积 ， 符 号 由 三 角形 的 方 
向 决定 。 每 个 元 素 归结 为 计算 少 一 个 点 的 多 边 形 面积 。 因 此 ， 多 边 形 面积 表示 为 三 角形 面积 的 加 和 





减 的 序列 。 






































D 当 多 边 形 的 各 个 部 分 不 相交 时 被 称 作 简单 多 边 形 。 
D 正常 顺序 既是 逆 时 针 方 向 。 
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def area(p): 


A= 0 
for i in range (len (p)): 
A += pli 1] [0] * pfi]{1] - pi] [0] * pli - 1] [1] 





return A / 2. 





e 计算 边缘 整数 点 的 数量 

为 了 简化 ， 我 们 假设 多 边 形 所 有 点 的 坐标 都 是 整数 。 这 样 一 来 ， 针 对 每 个 p 的 分 段 [a, b], W 
过 汇总 在 a 和 bb 之 间 点 的 数量 来 确定 解 。 为 了 不 重复 计算 ,汇总 不 包括 a。 如果 x 是 a 和 4 横 坐 标 
差 的 绝对 值 ，y 是 纵 坐 标 差 的 绝对 值 ， 则 点 的 数量 是 : 


















































了 如 果 x=0 
x 如 果 y=0 
xX 和} 的 最 大 公约 数 ”否则 








。 计算 内 部 整数 点 的 数量 
这 个 数量 通过 Pick 定理 获得 ， 它 与 多 边 形 的 面积 4、 内 部 整数 点 的 数量 n; 和 边缘 点 的 数量 n, 


有 关 ， 它 们 的 关系 由 以 下 公式 定义 : 


























n 
A=n+—- 
2 


i 


12.3 “最近 点 对 





输入 输出 


e 应 用 


宿营 区 随机 摆 放 了 很 多 帐 笑 。 每 个 帐篷 里 都 住 着 一 个 宿营 者 ， 拿 着 收音 机 。 我 们 希望 为 所 有 宿 
营 者 限定 一 个 音量 值 ， 好 让 任何 人 都 不 会 被 邻居 的 音乐 声 打扰 。 
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e 定义 

给 定 nn 个 点 p.,…,p,， 确 定 一 个 点 对 (p;, p)， 使 得 p; 和 ;之 间 的 欧 氏 距离 最 短 。 
e 线性 时 间 复 杂 度 的 随机 算法 

这 一 经 典 问题 有 好 几 个 复杂 度 为 O(nlogn) 的 算法 ， 使 用 的 都 是 扫描 法 或 分 治 法 。 我 们 下 面 介绍 
一 个 线性 时 间 复 杂 度 的 随机 算法 ， 也 就 是 说 ， 期 望 计 算 时 间 是 线性 的 。 根 据 我 们 的 经 验 ， 其 效率 只 
是 略微 优 于 扫描 算法 ， 但 实现 上 更 加 简单 。 

思路 是 在 任何 情况 下 ， 我 们 已 经 找到 了 一 个 距离 为 4 的 点 对 ， 希望 知 道 是 否 存 在 男 一 个 距离 更 
近 的 点 对 。 为 此 , 我 们 把 空间 在 两 个 方向 上 分 成 步 长 ?为 42 的 网 格 。 因 此 , 每 个 点 都 属于 网 格 中 的 

个 格子 。 设 已 确定 点 对 之 间距 离 至 少 是 4 的 所 有 点 的 集合 为 P， 那 么 每 个 格子 最 多 包含 一 个 P 中 

的 点 。 

网 格 由 一 个 字典 G 表示 ， 把 每 个 格子 及 其 包含 的 P 中 的 点 关联 起 来 。 当 把 P 中 的 一 个 点 p 添 
加 到 G 中 时 ， 只 需 测试 点 p 与 最 近 的 5 x 5 网 格 中 点 q 的 距离 (图 12.3 )。 当 发 现 一 个 点 对 的 距离 为 
d' 二 4 时 ， 我 们 把 网 格 步 长 设置 为 dy2 ， 然 后 从 头 开始 上 述 流程 。 




































































































































































图 12.3 每 个 网 格 中 的 格子 最 多 包含 一 个 点 。 当 考虑 一 个 新 的 点 p 
时 ， 只 需 测 量 它 与 周围 ( 白色 ) 格子 中 点 的 距离 即 可 


e 复杂 度 

假设 访问 G 的 时 间 都 是 常数 ， 那 么 计算 包含 给 定点 的 格子 的 时 间 也 是 常数 。 关 键 论据 是 ,假如 
给 定 输入 的 所 有 点 都 能 按照 统一 的 随机 顺序 来 处 理 ， 那 么 在 处 理 第 i 个 点 时 SiS n),， 优 化 距离 
d 的 概率 是 1/(i-1)。 所 以 期望 复 杂 度 数量 级 是 》” ,i/ (i-1) ， 与 n BAER. 
e 实现 细节 

为 了 在 给 定 步 长 的 网 格 中 计算 与 点 (x, y) 关联 的 格子 ， 只 需 把 各 个 坐标 除 以 步 长 ， 然 后 取 整 即 
可 。 特 别 要 注意 负 值 坐标 ， 因 为 在 Python 和 其 他 语言 中 ， 如 -1/2 的 取 整 结果 是 0， 而 不 是 我 们 想 
要 的 -1。 























中 ”网 格 中 一 个 格子 的 宽度 。 译 者 注 
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最 终 ， 选 择 网 格 步 长 为 d2 而 不 是 4， 保 证 每 个 格子 中 只 有 一 个 元 素 ， 方便 处 理 。 





from math import hypot # hypot (dx, dy) = sqrt(dx * dx + dy * dy) 
from random import shuffle 


def dist(p, q): 
return hypot(p[0] - q[0], p[1] - q[1] 


def floor(x, pas): 
return int(x / pas) - int(x < 0) 


def cell(point, pas): 
x, y = point 
return(floor(x, pas), floor(y, pas)) 


def ameliore(S, d): 
G Sup} # 网 格 
for p in S: 
(a, b) = cell(p, d / 2.) 
for al in range(a - 2, a+ 3): 
for bl in range(b - 2, b + 3): 
if(al, bl) in G: 
q = Glal, b1] 
pq = dist(p, q) 
if pq < d: 
return(pq, p, q) 
Gla, b] =p 
return None 


def closest _points(S): 
shuffle (S) 
assert len(S) >= 2 
p = S[0] 
q = S[1] 
d dist(p, q) 
while d > 0: 
r = ameliore(S, d) 
iE x: 
(dr py q) = E 
else: 
break 
return (p, q) 











12.4 简单 直线 多 边 形 


e 定义 
当 一 个 多 边 形 的 所 有 边 在 水 平方 向 和 垂直 方向 上 交替 切换 时 ， 它 被 称 作 直 线 多 边 形 。 当 其 所 有 
边 都 不 交 义 时 ， 它 就 是 简单 的 。 目 的 是 测试 一 个 给 定 的 直线 多 边 形 是 否 简单 。 
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输入 
输出 不 简单 gà 





Tuk 








e 测试 
如 果 一 个 多 边 形 是 直线 的 ,那么 其 每 个 点 之 前 和 之 后 的 边 都 有 一 个 与 之 水 平和 垂直 的 边 。 
此 ， 多 边 形 的 点 之 间 可 以 是 左右 和 上 下 关系 ， 一 个 简单 的 相 邻 测试 足以 完成 标注 (图 12.4), 











ALE 
右 下 


左下 角 


4124 直线 多 边 形 中 点 的 类 型 















































e SEA O(nlogn) 的 算法 
算法 通过 扫描 实现 。 按 照 坐标 的 字典 序 扫描 多 边 形 中 的 点 ， 并 维护 一 个 还 没有 访问 其 右 侧 点 的 
左 侧 点 集合 S$。 对 于 每 个 点 ，S 刚 开始 是 空 值 ， 我 们 执行 下 面 的 操作 。 
一 如 果 (x,y) 与 最 后 一 个 被 处 理 的 点 相同 ， 那 么 在 多 边 ] La AIEEE 
一 如 果 (x, y) 是 左 侧 点 ， 检 查 确认 y 尚未 存在 于 S 中 : RARE afi 寸 同一 纵 坐 标 上 
日 正 在 向 右 转 的 点 ， 因 此 这 两 个 横向 元 素 是 重 辣 的 。 
一 如 果 (x, y) 是 右 侧 点 ， 那 么 y 必须 存在 于 S 中 ， 因 为 其 左 侧 邻 点 已 被 访问 过 。 这 时 ， 我 们 把 
VAS 中 剔除 。 
一 如 果 (x,y) 是 下 方 点 ， 什 么 都 不 做 。 
一 如 果 (x, y) 是 上 方 点 ， 那 么 设 其 下 方 邻 点 为 (x, y')。 如 果 这 不 是 刚刚 被 处 理 过 的 点 ， 则 说 明 
线段 (x, y) - (x, y) MARE BABE REY; PU, RIEA S, ARPE y'<y"<y 的 值 
y"”。 这 说 明 一 条 纵 坐 标 为 y” ei ay- Co yy 交叉， 因此 多 边 形 就 











































































































不 是 简单 的 。 
e 复杂 度 
为 了 获得 一 个 合理 的 复杂 度 ， 在 S$ 上 执行 的 操作 要 足够 高 效 ， 比 如 : 
一 向 $S 中 添加 和 移 除 元 素 ; 
中 条 边 都 是 水 平 、 重 直 切 换 ， 所 以 两 条 边 一 定 会 以 90? 角 相 交 于 一 个 点 。 这 个 点 可 类 比 成 一 个 正四 


see 图 12.4 中 就 用 左上 、 左 下 、 右 上 、 右 下 来 对 直线 多 边 形 中 的 点 来 进行 分 类 。 





译 者 注 





检查 S 是 否 包含 
如 果 我 们 

















个 给 定 区 间 [a, b] 内 的 元 素 。 
一 个 数组 1 来 表示 S， 使 得 当 yeS 时 加]= -1， 和 否则 如 ]=0， 那 么 确定 在 S 中 是 否 
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存在 一 个 区 间 [a, b] 的 操作 就 变 成 在 t[a] A t[b] 之 间 的 区 间 中 寻找 -1。 因 此 ， 我 们 用 一 棵 线段 树 来 
表示 上 ( 见 4.5 节 )， 从 而 让 查询 一 个 区 间 中 最 小 值 和 更 新 数组 ! 的 操作 能 在 对 数 时 间 内 实现 ， 保 证 


算法 复杂 度 是 O(nlogn)。 


e 实现 细节 


比 起 处 理 没有 上 下 限 的 点 的 纵 坐 标 ， 我 们 更 关心 点 的 次 序 。 设 所 有 满足 大 入 n2 的 点 的 不 重复 








纵 坐 标的 列表 为 yy<…<x， 于 是 当 且 仅 当 如] 
个 元 素 Yj» 只 需 和 


























-1 时 ， 有 JeS。 为 了 确 
3E t TE tli+1] 和 本 -1] 之 间 的 最 小 值 是 -1。 











定 S 在 区 间 Ly, y] 4 


PP 包含 一 













































































def is simple (polygon): 
n = len(polygon) 
order = list (range (n) ) 
order.sort (key=lambda i: polygon[i]) # 字典 序 
rank to y = list(set(p[1] for p in polygon) ) 
rank _to_y.sort() 
y_to_rank = {rank_to_y[i]: i for i in range(len(rank_to_y))} 
S = RangeMinQuery([0] * len(rank to y)) # 扫描 结构 
for i in order: 
x, y = polygon[i 
rank = y_ to_rank[y] 
# -- 点 的 类 型 
right x = max(polygon[i - 1][0], polygon[(i + 1) % n] [0] 
left = x < right_x 
below_y = min(polygon[i - 1][1], polygon[(i + 1) % n] [1] 
high = y > below_y 
if left: s PRES y 
if S[rank]: 
return False 两 条 水 平 线段 相交 
S[rank] = -1 FE y APIA S 
else: 
S[rank] = 0 从 S 中 删除 y 
if high: 
lo = y to rank[below y] 确认 S 在 lo + 1 和 rank - 1 之 间 
if(below_y != last_y or last y == y or 
rank - lo >= 2 and S.range min(lo + 1, rank)): 
return False HE A AO ZKAL ZG ER EW 
last y = y 记录 下 来 ， 准 备 下 一 次 迭代 
return True 








13m 


很 多 处 至 





几何 图 形 的 问题 与 长 方形 有 关 ， 比 如 房屋 图 纸 或 计算 机 屏幕 的 显示 。 长 方形 有 时 是 直 


长 方形 


线 多 边 形 ， 即 边 和 轴 平 行 ， 这 让 处 理 变 得 容 


有 介绍 o 





13.1 组 成 长 方形 


e 定义 


MERE n 个 点 的 集合 S， 我 们 希望 确 








直线 多 边 形 。 




















7, 
7 








易 。 几 何 学 中 一 个 重要 的 算法 技巧 是 扫描 ， 在 13.5 节 中 




















o 算法 复杂 度 为 O(n?+m) 





距离 组 成 。 为 测试 签名 是 否 一 致 ， 只 需 在 





定 S$ 中 有 4 个 角 点 的 所 有 长 方形 。 这 些 长 方形 不 一 定 是 





其 中 m 是 解 的 数量 。 关 键 测试 要 看 两 对 对 角 点 的 签名 是 否 一 致 。 签 名 由 中 心 以 及 点 与 点 之 间 的 























中 c = (p+q)2 是 p 和 gq 的 中 心 点 , d= lq - 


方形 的 点 (图 13.1 )。 


13.1 


对 角 点 对 的 相同 签名 ， 


个 字典 中 存储 拥有 相同 键 (c, d) 的 所 有 点 对 p 和 gq， 其 
凡是 两 点 间距 离 。 拥 有 相同 签名 的 点 对 就 是 组 成 $ 中 正 


对 角 线 从 中 被 切 开 ， 从 中 间 到 各 点 距离 相等 
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o 实现 细节 
为 了 让 算法 的 性 能 更 好 并 只 处 理 整数 ， 在 计算 c 时 ， 除 以 2 的 操作 被 忽略 ， 在 计算 4 时 ， 根 被 
Bie? 


def rectangles from points (S): 











answ = 0 
pairs = {} 
for j in range(len(S)): 
for i in range(j): 

i] 


px, py = Sl 
qx, qy = S[j] 
center (px + qx, py + qy) 


dist = (px = qx) * (px = qx) + (py = qy) * (py = qy) 
(center, dist) 
if sign in pairs: 
answ += len(pairs[sign]) 
pairs[sign].append((i, j)) 
else: 
pairs[sign] = [(i, j)] 
return answ 


sign = 











13.2 ”网 格 中 的 最 大 正方 形 


e 定义 
给 定 一 个 格式 为 n xm 的 点 阵 黑 白 图 像 ， 我 们 希望 确定 其 中 最 大 的 纯 黑 色 方 块 (图 13.2 )。 




















图 13.2 一 个 面积 为 的 最 大 黑色 色 块 ， 其 右 下 角 点 (i j 包含 三 个 大 小 为 k-1 BA 
TAAA (i, -1)、(i-1, j-1) 和 (i-1,】) 的 正方 形 黑色 色 块 





@ 在 计算 两 点 间距 时 需要 开平 方 根 ， 因 为 c 和 qd 只 作为 签名 使 用 而 并 不 需要 算出 实际 距离 ， 因 此 不 需 
要 开平 方 。 译 者 注 
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e 线性 时 间 复 杂 度 的 算法 

这 个 问题 可 以 简单 使 用 动态 规划 算法 解决 。 假 设 所 有 行 被 从 上 到 下 编号 ， 所 有 列 被 从 左 到 右 编 
号 。 一 个 方块 的 右 下 角 点 为 GA), RP “ARF (i, 7)”。 如 果 这 个 方块 的 边 长 为 k， 那 么 它 由 格子 
(i', 7') Ab, JPA i-k<i Sib j-k<j' <j. 

对 于 网 格 的 每 个 格子 (i), BATS RRA k, ER k HERF (G, j) 的 正方 形 为 纯 黑 
色 。 将 该 值 记 作 Ai jlo WRF @ 旋 是 白色 的 ,那么 4 已 尹 =0， 说 明 这 个 正方 形 不 存在 。 

所 有 边 长 为 大 的 纯 黑 色 正 方形 包含 4 MAKA k-1 的 正方 形 。 因 此 ， 当 且 仅 当 Ali-1, j], Ali-1, 
j-1] Al Afi, 7-1] 都 至 少 等 于 k-1， 且 及 宇 1 时 ，4[i, 放 =k。 由 此 可 得 以 下 递归 公式 : 


ait 由 有 开关 下 三 廊下 



































13.3 直方 图 中 的 最 大 长 方形 


e 定义 
给 定 一 个 直方 图 ， 其 格式 是 由 正 整 数 或 空 值 zx,…, x 组 成 的 数组 。 目 标 是 在 这 个 直方 图 中 找 
到 一 个 面积 最 大 的 长 方形 。 也 就 是 说 ， 找 到 一 个 区 间 [1, r)， 使 得 面积 (x - 1) xh 最 大 且 h= 


min, < i<rÑio 


















































e 应 用 

在 大 西洋 底 铺设 着 连接 了 欧洲 和 美洲 的 通信 电缆 。 这 些 电 线 的 技术 特性 会 因 海水 和 温度 
的 变化 而 随时 间 改 变 。 因 此 ， 在 任何 时 候 都 会 有 一 个 随时 间 变 化 的 最 大 传输 速率 。 在 信号 传输 
过 程 中 可 以 改变 传输 速率 ,但 在 终端 之 间 变 化 传输 速率 会 影响 期 间 的 所 有 通信 。 假 设 我 们 在 一 
天 中 每 60 x 24 分 钟 提前 知道 了 最 大 通信 和 速率。 现在， 我 们 希望 找到 一 个 时 间 区 间 和 一 个 速率 ， 
以 便 传输 最 大 量 信息 又 不 会 断 开 连 接 。 问 题 归 结 为 在 一 个 直方 图 中 找到 一 个 最 大 面积 长 方形 的 


问 题 o 


e 线性 时 间 复杂 度 的 算法 

这 是 一 个 扫描 算法 。 对 于 每 个 数组 的 前 级 xs xi1， 维 护 一 个 长 方形 集合 ， 而 我 们 尚未 确定 长 
方形 的 右 侧 边 。 这 些 长 方形 通过 一 个 整数 对 (1, hh) 定义 ， 其 中 1 是 左边 界 ，h ERE. MWA, RIE 
需 考 虑 其 中 最 大 的 长 方形 ， 这 样 一 来 ，h 就 是 x, xn. xii 中 最 大 的 ， 且 在 xz <h A= 0。 因 
此 ， 这 个 长 方形 无 法 在 不 超出 直方 图 的 情况 下 向 左 或 向 上 变 大 。 我 们 把 整数 对 存储 到 一 个 按照 h FE 
序 的 栈 中 。 有 意思 的 是 ， 这 些 整 数 对 同样 也 按照 ! 排序 。 
现在 ， 对 于 每 个 值 x;， 我 们 可 能 已 经 找到 了 某 些 长 方形 的 右 侧 边 。 当 有 二 x 时 ,在 栈 上 以 (4, h) 
编码 的 所 有 长 方形 也 是 这 种 情况 。 这 样 一 个 长 方形 的 宽度 是 i - 1。 但 x; 的 值 同样 会 新 建 一 个 新 整数 
对 (7 xo)。 左 侧 边 7 要 么 是 最 后 一 个 出 栈 的 长 方形 1 值 ; 要 么 在 没有 出 栈 操 作 时 ,1'=i (图 13.3 )。 
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图 13.3” 当 直方 图 数字 增长 时 ， 拐 点 就 会 堆 番 起来; 当 直 方 图 数字 减 小 时 ， 需 要 让 过 
高 的 那些 角 点 出 栈 。 测 试 所 有 可 能 的 长 方形 ， 再 把 最 后 一 个 出 栈 的 角 点 补 


到 更 低 的 高 度 





def rectangles from histogram (了 ) : 








best = (float('-inf'), 0 0, 0) 
S = [] 
H2 = H + [float('-inf')] # 用 额外 的 元 素 清 空 栈 














for right in range (len (H2)): 
x = H2[right] 
left = right 
while len(S) > 0 and S[-1][1] >= x: 
left, height = S.pop() 
+ (HER, Al, BE, Afi) 
rect = (height * (right - left), left, height, right) 
if rect > best: 
best = rect 
S.append((left, x)) 
return best 
































13.4 网 格 中 的 最 大 长 方形 


e 应 用 
给 定 一 块 布 满 了 树 的 建筑 工地 ， 我 们 希望 找到 一 块 面积 最 大 的 长 方形 地 块 来 到 
不 需要 砍 树 。 


e 定义 














EBT, mm 





给 定 一 个 格式 为 n x m 的 像素 点 阵 黑白 图 片 ， 我 们 希望 确定 其 中 最 大 的 纯 黑色 长 方形 。 这 里 的 














长 方形 是 一 段 相交 成 行 的 网 格 和 一 段 成 列 的 网 格 ( 图 13.4 )。 
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图 13.4 网 格 中 面积 最 大 的 黑色 长 方形 


e 线性 时 间 复 杂 度 的 算法 














解决 方案 是 把 问题 简化 为 查找 一 个 直方 图 中 的 最 大 长 方形 问题 。 








i 行 的 最 大 长 方形 。 为 此 ， 我 们 维护 一 个 数组 +， 它 给 每 个 列 7 














对 于 每 行 ?， 寻 找 底部 位 于 
一 个 最 大 数量 kx， 使 得 位 于 (i, j) 和 








(i, j-k+1) 之 间 所 有 像素 点 都 是 黑色 。 因 此 ,1 定义 了 一 个 直方 
数组 t 根 据 每 一 列 的 像素 颜色 一 行 接 一 行 地 更 新 。 





图 ， 我 们 在 其 中 寻找 最 大 的 长 方形 。 





def rectangles from_grid(P, noir=1): 


rows = len(P) 
cols = len(P[0] 
t = [0] * cols 
best = None 


for i in range(rows): 
for j in range(cols): 


if P[i] [j] == noir: 
t[j] += 1 
else: 
t[j] = 0 
(area, left, height, right) = 


alt left, i, right, i-height) 
if best is None or alt > best: 
best alt 


return best 


(area, 





rectangles from_histogram(t) 








13.5 ”合并 长 方形 


e 定义 
给 定 n 个 直线 长 方形 ， 我 们 希望 计算 其 
连通 区 域 的 数量 。 














PSE EY TE 








amy 
| 





i 积 。 使 用 同样 的 技术 ,我们 可 以 计算 其 边 长 和 
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e 复杂 度 为 O(n) 的 算法 

无 论 何 种 算法 ， 都 要 测试 所 有 长 方形 的 边缘 在 每 个 轴 上 是 否 最 多 有 2n 个 点 。 这 些 点 形成 一 个 
网 格 ， 由 O(n?) 个 格子 组 成 。 这 些 格子 要 么 完全 被 一 个 长 方形 覆盖 ， 要 么 与 所 有 长 方形 分 离 (Al 
13.5 )。 第 一 个 简单 方案 是 确定 一 个 布尔 型 数组 ， 说 明 每 个 格子 是 否 是 长 方形 并 集 的 一 部 分 。 只 需 
计算 格子 的 总 面积 就 能 知道 并 集 的 面积 。 处 理 每 个 长 方形 的 工作 时 间 是 O(n?) ， 算 法 的 整体 复杂 度 
为 On’) 





















































图 13.5 网 格 有 O(n) 行 和 O(n) 列 ， 每 个 格子 要 么 在 长 方形 的 并 集中 ， 
要 么 与 之 分 离 


e 复杂 度 为 Oln?) 的 扫描 算法 

我 们 用 一 条 水 平 线 从 上 到 下 扫描 所 有 长 方形 。 长 方形 的 左 侧 边 和 右 侧 边 把 横 轴 分 割 为 O(n) 个 
区 间 。 在 所 有 情况 下 ， 我 们 维护 一 个 布尔 型 数组 ， 它 代表 着 每 个 区 间 被 几 个 长 方形 覆盖 。 对 至 少 被 
一 个 长 方形 覆盖 的 区 间 长 度 求 和 ， 我 们 可 以 确定 扫描 线 与 长 方形 并 集 的 重 到 长 度 。 当 我 们 把 扫 摘 线 
向 下 移动 A 单位 时 ， 只 需 把 重 秋 长度 乘 以 A， 并 将 其 记 入 一 个 并 集 面积 总 数 的 变量 中 。 

扫描 线 沿 着 变化 事件 一 点 点 地 前 进 。 一 个 变化 事件 表示 一 个 长 方形 的 顶 边 或 底 边 。 人 处 理 一 个 顶 
边 会 增加 长 方形 覆盖 区 间 的 计数 器 ， 而 处 理 一 个 相关 底 边 会 减少 计数 器 。 这 部 分 需要 的 时 间 成 本 是 
O(n)， 算 法 的 整体 复杂 度 即 为 0(n?)。 


e 复杂 度 为 O(nlogn) 的 算法 

这 里 使 用 的 数据 结构 一 一 线段 树 ， 与 在 查询 下 标 范围 内 最 小 值 问题 中 使 用 的 数据 结构 类 似 ( 见 
4.5 节 )。 该 数据 结构 被 两 个 大 小 为 2n-1 的 数组 L 和 +t 初始化。 思路 是 长 方形 的 横 坐 标 把 横 坐 标 轴 
分 割 成 了 很 多 分 段 。 第 i 条 线段 的 长 度 是 L[]。 在 从 左 往 右 扫 描 时 ， 我 们 希望 为 每 个 分 段 维护 包 含 
该 线段 的 长 方形 数量 。 这 一 信息 被 存储 在 数组 t 中。 

数据 结构 可 执行 以 下 操作 : 

一 change (i, k, d) 方法 将 值 4 添加 到 输入 ty] F, Hi <j<k; 

一 cover () 方法 返回 在 下 标 j 上 的 总 和 Ly], FE 7] 关 0。 

change 操作 在 扫描 遇 到 一 个 长 方形 的 定 边 (d= 1) 或 底 边 (d= -1) 时 被 调用 。cove 方法 用 于 
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确定 扫描 线 和 长 方形 的 重合 线段 长 度 。 扫 描 线 每 次 下 降 时 

R, 我们 可 以 借 此 确定 长 方形 并 集 的 面积 。 
数据 结构 由 一 棵 二 叉 树 组 成 ， 其 每 个 节点 p 

又 权 有 三 个 属性 : 

一 “jel iN, lp] 是 ZLD] 的 总 和 

一 当 jel 时 , cip] 是 被 加 入 所 有 tU] 的 一 个 数 ; 

一 jel H (40M, sip] Æ L] 的 总 和 

树 的 根 是 1 号 节点 ,，cover ( ) 的 结果 被 存在 s[1] 中 。 












































相关 节点 到 根 节点 的 路 径 上 所 有 节点 p 的 c[p] 值 之 和 为 0]。 








query ) 结构 一 样 ， 其 更 新 需要 呈 对 数 的 时 间 复 杂 度 。 


负责 数组 上 中 (也 是 工 中 


数组 1B 


一 信息 与 扫描 线 的 垂直 移动 距离 相 











) 的 一 个 下 标 区 间 I。 二 


的 式 地 存储 在 属性 c Ho WP hj 
与 最 小 区 间 查 询 (minimum range 





class Cover query: 





def init (self, len): 
assert len != [] # 
self.N = 1 
while self.N < len( len): 
self.N *= 2 
self.c = [0] * (2 * self.N) # 
self.s = [0] * (2 * self.N) # 
self.w = [0] * (2 * self.N) # 
for i in range(len(_len)): 
self.w[self.N + i] = _len[i] 
for p in range(self.N - 1, 0, -1): 
self.w[p] = self.w[2 * p] + self.w[2 * p + 
def cover(self): 


return self.s[1] 


def change(self, i, k, delta): 
self. change(1, 0, self.N, i, k, delta) 
def change(self, p, start, span, i, k, delta): 


if start + span <= i or k <= start: 
return 
if i <= start and start 
self.c[p] += delta 
else: 
self. 
self. 
if self.c[p] == 
if p >= self.N: 
self.s[p] = 0 
else: 
self.s[p] = 


+ span <= k: 


_change(2*p, start, span // 2, i, k, 


self.s[2 * p] 
else: 


self.s[p] = self.w[p] 





_change(2*p + 1, start + span // 2, span 


# 


我 们 假设 len 是 排 好 序 的 


--- 3B 
--- 包含 


delta) 
df 2; i; 


k, delta) 


--- 叶子 节点 


+ self.s[2 * p + 1] 











算法 的 复杂 度 O(nlogn) 由 横 坐 标 和 纵 坐 标的 排序 证 明 。 







































































0/13/8 
0/6/5 0/7/3 
c/l/s 
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| So So 
0/2/0 | 1/2/2 | & | 三 | 0/0/2 S|) 133 |S 
一 | So © 
l 1 2 |10 0 0 0 0 
扫描 线 --4----4----4 --[- 
图 13.6 ”数据 结构 和 扫描 的 图 示 
def union rectangles (R): 
if R == []: 
return 0 
x= [] 
eos 
for j in range (len (R)): 
(xl, yl, x2, y2) = R[j] 


assert xl <= x2 and yl <= y2 
X.append (x1) 








X.append (x2) 
Y.append((yl, +1, j)) # 生成 事件 
Y.append((y2, -1, j)) 
X.sort() 
Y.sort() 
X2i = {X[i]: i for i in range(len(X) ) } 
_len = [X[i + 1] - X[i] for i in range(len(X) - 1)] 
C = Cover query(_ len) 
area = 0 
last = 0 


for(y, delta, j) in Yi 
area += (y - last) * C.cover() 
last = y 
(x1, yl, x2, y2) = R[j] 
i = X2i[x1] 
k = X2i[x2] 
C.change(i, k, delta) 
return area 
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13.6 不 相交 长 方形 的 合并 






































e 定义 
给 定 n 个 不 相交 的 直线 长 方形 ， 我 们 希望 确定 所 有 邻接 的 长 方形 对 。 
e 应 用 





算法 可 以 被 用 于 计算 并 集 的 边 长 ， 实 现 方法 是 从 长 方形 总 边 长 中 去 除 邻接 长 方形 的 接触 边 长 。 
这 一 长 度 值 必须 带 有 一 个 系数 2， 因 为 去 除 一 段 接 触 边 长 也 就 是 去 除 每 个 长 方形 的 一 段 边 长 。 男 一 
个 应 用 是 确定 邻接 长 方形 的 连通 分 量 ( 图 13.7 )。 
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1 
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图 13.7 确定 长 方形 (2, 4)、(2, 5)、(3, 5) 和 (4, 5) 之 间 的 邻接 关系 


e SEA O(nlogn) 的 扫描 算法 

我 们 首先 介绍 如 何 利 用 长 方形 的 左 、 右 边 来 确定 邻接 长 方形 。 上 下 邻接 的 情况 也 是 一 样 的 。 首 
先 用 nn 个 长 方形 中 每 个 长 方形 的 4 个 角 点 建立 一 个 事件 列表 。 每 个 事件 是 一 个 多 元 组 (x, y, ic), 其 
中 (x, y) 是 第 i 个 长 方形 角 点 <c 的 坐标 , c 对 于 右 下 、 右 上 、 左 下 和 左上 的 取 值 分 别 为 0、1、2、3。 
然后 ， 所 有 事件 按照 字典 序 来 处 理 ， 借 此 在 一 个 列 中 从 下 往 上 、 从 左 到 右 地 扫描 长 方形 的 各 个 角 
点 。 当 角 点 相同 时 ， 先 处 理 在 长 方形 顶 边 上 的 角 点 。 

然后 , 我 们 只 需 维 护 一 个 已 处 理 过 底 边 角 点 , 但 还 没有 处 理 顶 边 角 点 的 长 方形 列表 "。 由 于 长 方 
形 彼此 不 相交 ， 这 个 列表 中 最 多 有 两 个 长 方形 ， 一 个 位 于 左 列 ， 一 个 位 于 右 列 。 一 个 底 边 角 点 将 一 
个 长 方形 加 入 这 个 列表 ， 而 一 个 顶 边 角 点 则 将 其 移 除 。 最 终 ， 当 日 仅 当 两 个 长 方形 同时 出 现在 列表 
中 时 ， 它 们 才 是 邻接 的 。 
e 变种 

如 果 在 问题 描述 中 ,我们 仪 将 共用 一 个 角 点 而 非 一 段 邻 边 重合 的 长 方形 定义 为 邻接 ， 那 么 我 们 
需要 改变 处 理事 件 的 优先 级 ， 在 处 理 两 个 相同 的 角 点 时 优先 处 理 底 边 角 点 ， 然 后 再 处 理 顶 边 角 点 2。 



















































































@ 因为 是 从 下 往 上 扫描 。 一 一 译 者 注 
D 因为 是 从 下 往 上 扫描 ， 先 处 理 底 边 角 点 ， 后 处 理 顶 边 角 点 。 于 是 ， 前 面 的 长 方形 就 不 会 因为 顶 边 被 
处 理 而 从 列表 中 被 移 除 。 译 者 注 





第 14 章 计算 


很 多 问题 都 能 通过 快速 计算 解决 ， 比 如 素数 的 二 项 式 系数 问题 。 本 章 将 一 些 高 效 解决 如 算数 、 
表达 式 求 值 、 线 性 系统 求解 等 经 典 整 数 问题 的 实现 方法 进行 了 简单 归 类 。 








给 定 两 个 整数 a 和 b， 我 们 寻找 最 大 整数 p， 使 得 a 和 6b 都 可 以 表示 为 p 的 倍数 ，p 即 为 两 个 数 
的 最 大 公约 数 。 

最 大 公约 数 的 计算 可 以 使 用 递归 方式 快速 实现 。 这 里 有 一 个 记忆 术 : 从 第 二 次 迭代 开始 ， 我 们 
让 第 二 个 参数 总 是 比 第 一 个 参数 小 ， 即 a mod b < bo 




















def pgcd(a, b) 
return a if b == 0 else pgcd(b, a%b) 











14.2 ” 贝 祖 等 式 


© 定义 
对 于 两 个 整数 a 和 b， 我 们 希望 确定 两 个 整数 w 和 v， 使 得 在 4 是 a 和 4 最 大 公约 数 的 情况 下 
F au+bv=d, 

这 个 计算 基于 一 个 简单 结论 。 如 果 a=gb+r、au+bv=4d 与 (gb+7n)u+bv=4d 相关 ， 对 于 pbu'+ 
rv'=d 有 : 
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u'=qut+v u=y 
了 © if 了 
v =u v=u' -qv 











AMNA OlogaHogh) FERRER, EX, PSA mramh. 


e 变种 

有 些 问题 更 关心 大 数字 的 计算 ， 因此 需要 返回 一 个 大 数 除 以 一 个 大 素数 p 的 余数 来 确定 结 
果 是 否 成 立 。 由 于 p 是 素数 ,我们 可 以 把 它 除 以 一 个 非 p 倍数 的 整数 a: a 和 pp HEM, MUN 
祖 系 数 满足 au + pu=1; 因此 au 的 值 是 1 除 以 p 求 余 ， 而 4 是 a 的 倒数 ， 所 以 p 除 以 a 也 就 是 
乘 以 Uo 





















































def bezout(a, b): 


if b == 
return(1, 0) 

else: 
u, v = bezout (b, a $ b) 
return(v, u - (a // b) * v) 


def inv(a, p): 
return bezout (a, p)[0] % p 











14.3 ”二 项 式 系数 








当 计算 4 时 ， 分 别 计算 n(n-1),…,(n-k+1) A RY SEAT EN, II Ee RE AERAN 
况 。 我 们 更 倾向 于 使 用 以 下 结论 : i 个 连续 整数 的 乘积 一 定 包含 一 个 能 被 i 整除 的 元 素 。 
def binom(n, k): 
prod = 1 
for i in range(k): 
prod = (prod * (n - i)) // (i + 1) 
return prod 


























在 大 多 数 问题 中 ， 计 算 二 项 式 系数 都 需要 除 以 一 个 素数 p。 基 于 贝 祖 等 式 对 系数 的 计算 ， 代 码 
WF, ZEN O(k(logk+logp))。 





def binom_modulo (n, k, p): 
prod = 1 
for i in range(k): 
prod = (prod * (n = i) * inv(i +1, p)) SP 
return prod 

















一 个 替代 方案 是 使 用 动态 规划 来 计算 帕斯卡 三 角形 。 当 (n, 有 数 对 非常 多 时 ， 这 种 方案 在 计算 
n A)| =e 
H 时 很 有 意义 。 
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14.4 RK 


e 定义 
给 定 a 和 5b， 我 们 希望 计算 w%%。 重 申 一 次 ， 由 于 结果 数值 可 能 很 大 ， 通 常会 要 求 把 算式 的 结 
除 以 给 定 整数 qg 并 求 余 ， 但 这 不 会 改变 问题 的 本 质 。 


e 复杂 度 为 O(logb) 的 算法 
简单 解法 会 把 a 相 乘 b-1 次 。 但 我 们 可 以 利用 关系 a** a* = a 来 快速 计算 形式 为 a1, a, a, 
as,… 的 a 的 竺 。 一 个 技巧 就 是 把 宪 次 b 用 二 进 制 拆 分 ， 比 如 : 


13 84441 
a =a 


















































-a-at-a@ 


为 了 完成 计算 ,只 需 生 成 a 的 O(logsb) UE. 





def fast_exponentiation (a, b, q): 
assert a >= 0 and b >= 0 and q >= 1 









































p=0 # 只 用 于 记录 
p2 = 1 # 2 ^p 
ap2 = aa gd fa^ (2 ^p) 
result = 1 
while b > 0: 
if p2 & b> 0: # b 由 a^(2^p) 拆 分 而 来 
b -= p2 
result = (result * ap2) % q 
p += 1 
p2 *= 2 
ap2 = (ap2 * ap2) 3q 








return result 





e 变种 
这 个 技巧 也 可 以 用 于 和 矩阵 乘法 。 设 一 个 矩阵 A 和 一 个 正 整数 2， 人 快速 求 寡 算法 能 在 O(logh) 次 
和 矩阵 乘法 运算 内 计算 AS 

















14.5 ”素数 


对 于 给 定 n， 我 们 寻找 所 有 小 于 的 素数 。“ 挨 拉 托 斯 特 尼 筛 法 ”是 实现 目标 的 最 简便 方式 。 我 
们 从 一 个 所 有 小 于 的 整数 列表 开始 : 首先 划 掉 0 和 1; 然后 ， 对 于 每 个 p=2,3,4,…,n-1， WE p 
没有 被 划 掉 ， 那 么 它 就 是 素数 ; 在 这 种 情况 下 ， 我 们 把 p 的 所 有 倍数 都 划 掉 。 整 个 过 程 的 复杂 度 分 
































Q 这 里 只 需 计 算 二 进 制 拆 分 后 的 最 高 次 畦 。 因 为 在 二 进 制 拆 分 的 过 程 中 ， 计 算 最 高 次 霸 时 已 计算 过 所 
有 比 它 小 的 圭 ， 以 便 使 用 动态 规划 算法 ， 利 用 已 算 好 的 结果 。 一 一 译 者 注 
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析 起 来 很 繁琐 ， 其 值 是 O(nloglogn)。 
。 实现 细节 

FÉ 
行 迭 代 时 的 步 长 应 当 是 2， 从 而 只 测试 所 有 奇数 。 














i 提供 的 实现 方法 通过 划 掉 0、1 以 及 所 有 2 的 倍数 来 节省 时 间 。 在 这 种 情况 下 ， 在 对 p 进 














def eratosthene(n): 
P = [True] * n 
answ = [2] 
for i in range(3, n, 2): 
if P|]: 
answ.append (i) 
for j in range(2 * i, n, i): 
P[j] = False 
return answ 
+ :| $, 
14.6 ”计算 算数 表达 式 
° 定义 








给 定 一 个 遵循 固定 语法 规则 的 表达 式 ， 我 们 希望 建立 语法 
(图 14.1)。 


+ 
/ Ag 
A N 
* 2 
Z N 
3 4 
图 14.1 表达 式 2+(3x4)/2 相 关 的 树 


e 方法 





树 或 者 计算 出 该 表达 式 的 值 








一 般 来 说 ， 问 题 的 解决 方式 是 通过 扫描 带 或 分 词 带 把 包含 表达 式 的 字符 串 分 割 为 词汇 单元 流 。 








然后 根据 词汇 单元 ,使 用 解析 器 来 按照 语法 规则 建立 语法 树 。 








但 是 ， 如 果 语 法 和 算数 表达 式 的 语法 类 似 ， 我 们 可 以 
存 值 ， 另 一 个 栈 保 存 运 算 符 。 遇 到 一 个 数值 ， 就 将 其 原样 存 和 保存 
在 把 它 加 入 运算 符 栈 之 前 ， 需 要 执行 以 下 操作 : 当 运 算 符 栈 顶 9 HIT 
q 出 栈 ， 最 后 7 
值 栈 。 
使 用 同样 






































使 用 更 容易 实现 的 P 


HAE a Fl b 也 出 栈 ， 然 后 再 把 表达 式 a q b (4a 与 5 进行 gq 运算 的 结 





SITE + 一 个 栈 保 
由 的 栈 。 对 于 遇 到 的 运算 符 p， 
i 先 级 至 少 和 p 相等 时 ， 我 们 把 
) 的 值 加 入 数 





的 方式 ， 运 算 符 的 求 值 被 延期 处 理 ， 直 到 优先 级 规则 强制 要 求 求 值 ( 图 14.2 )。 
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图 14.2 处理 表达 式 2+ 3x 4/2 的 例子 ， 使 用 “;” 作 为 表达 式 终止 符 


e 电子 表格 的 例子 


考虑 一 个 








电子 表格 ， 其 每 个 格子 可 以 保存 一 个 值 或 一 个 算数 表达 式 。 算 数 表达 式 可 以 由 常数 值 


和 格子 的 标识 符 组 成 ， 并 由 运算 符号 - 、+ 、*、/ 和 括号 连接 起 来 。 


我 们 可 以 














j 一 个 整数 、 一 个 字符 串 或 者 由 两 个 运算 数 和 一 个 运算 符 组 成 的 三 元 组 来 表示 一 个 算 














数 表达 式 。 算 数 表达 式 的 数值 计算 通过 以 下 递归 方法 实现 。 其 中 cell 是 一 个 字典 ， 将 格子 的 名 字 


与 内 容 关 联 起 来 。 











else: 





def arithm expr eval (cell, expr): 
if isinstance (expr, tuple): 
(left, op, right) = expr 
l = arithm expr eval (cell, left) 
r = arithm_expr_eval(cell, right) 
if op == '+':; 
return 1 + r 
if op == '-': 
return 1 - r 
if op == '*': 
return 1 * r 
if op == '/': 
return 1 // r 
elif isinstance (expr, int): 
return expr 


cell[expr] = arithm expr eval (cell, cell[expr]) 
return cell[expr] 











语法 树 按 
其 他 操作 ; A 








了 在 处 理 结束 
FEM fe} 








照 上 述 方法 来 建立 。 注 意 对 括号 的 特殊 处 理 : 左 插 号 总 被 加 入 运算 符 堆栈 ， 而 没有 
括号 让 运算 符 与 相关 左 括号 的 顶点 〈 即 以 它 为 根 的 子 树 ) 组 成 的 表达 式 并 出 栈 。 为 
时 彻底 清空 栈 ,我 们 在 字符 流 尾部 加 入 “;” 作 为 表达 式 的 结尾 ， 并 赋予 它 最 低 的 优 
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priority =" OF. "C's yp “Ps 2, Vets Sp TPS 3p Terg 4) Tte 4} 


def arithm expr parse (line): 





vals = [] 
ops = [] 
for tok in line + [';']: 
if tok in priority: # tok 是 一 个 运算 符 
while tok != '(' and ops and priority[ops[-1]] >= Priority[tok] : 
right = vals.pop() 
left = vals.pop() 
vals.append((left, ops.pop(), right) ) 
if tok == ')': 
ops. pop () # 这 是 与 它 相 关 的 左 括号 
else: 
ops.append (tok) 
elif tok.isdigit(): # tok 是 一 个 整数 
vals.append (int (tok) ) 
else: # tok 是 一 个 标识 符 


vals.append (tok) 
return vals.pop() 











o 陷阱 
在 实现 上 述 代 码 的 过 程 中 ， 大 家 会 经 常 犯 这 样 一 个 书写 错误 : 











vals.append((vals.pop(), ops.pop(), vals.pop())) 











鉴于 append 方法 处 理 参数 的 顺序 , 这 使 得 表达 式 左 右 两 边 的 值 相反 "， 导 致 我 们 不 想 要 的 


效果 。 


14.7 ”线性 方程 组 


e 定义 





线性 方程 组 由 个 变量 和 m 个 线性 方程 组 成 。 正 式 来 讲 ， 给 定 一 个 维度 为 n x m WERE A, F 




















一 个 大 小 为 m 的 列 向 量 5， 目 的 是 找到 一 个 向 量 x， 使 得 Ax = bo 


。 应 用 : 随机 漫步 
假设 一 张 连通 图 的 每 条 弧 上 都 标注 了 概率 ， 离 开 弧 的 权重 总 和 是 1。 这 样 的 





























图 被 称 为 马尔 科 夫 





链 。 随 机 漫步 从 一 个 顶点 wu 开始， 然后 对 于 每 个 经 过 的 顶点 u 都 会 有 一 条 标注 概率 的 弧 (u, v) 通过 。 





我 们 想 知道 对 于 每 个 顶点 v， 随 机 漫步 到 达 v 所 需 的 时 间 x,。 定 义 xw= 0 Rx, = 
中 pw 是 弧 (u,v) 上 的 概率 ; 当 不 存在 这 条 弧 时 ， 概 率 值 为 0。 








æ +p, 其 


© 比如 a-b 处理 成 了 D-a。 不 同 编程 语言 在 处 理 方 法 或 函数 的 参数 列表 时 有 不 同 的 行为 方式 ， 有 的 从 左 





往 右 处 理 ， 有 的 从 右 往 左 处 理 ， 写 程序 时 要 特别 注意 。 译 者 注 
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此 外 ， 还 存在 与 随机 漫步 相关 的 另外 一 种 应 用 。 在 上 步 以 后 ， 每 个 顶点 都 有 一 个 出 现 漫步 者 的 
概率 。 在 某 些 情况 下 ， 漫 步 会 倾向 于 一 种 稳定 的 分 布 。 计 算 这 个 分 布 归结 为 解决 一 个 线性 方程 组 问 
题 ， 其 中 矩阵 A 主要 编码 了 所 有 弧 的 概率 ， 而 我 们 寻找 的 时 间 * 就 是 这 个 稳定 分 布 的 值 。 

e 应 用 : 重 物 和 弹簧 系统 

假设 一 个 系统 中 有 一 些 通 过 弹簧 连接 的 重 球 ， 弹 簧 自身 的 重量 可 以 忽略 。 某 些 弹 簧 被 挂 在 房 
项 ， 弹 簧 可 以 被 拉 伸 或 压缩 (图 14.3 )。 给 定 球 的 位 置 和 重量 ， 我 们 想 知道 这 个 系统 是 稳定 的 ， 还 
是 马上 会 运动 。 因 此 ， 目 标 就 是 找到 每 个 弹簧 两 端 受 力 的 值 ， 并 尝试 让 重 球 所 受 的 各 种 力 能 相互 抵 
消 ， 包 括 重力 。 这 又 重新 加 到 了 求解 线性 方程 组 问题 。 


; 







































































A143 重 物 和 弹簧 系 统 


° 应 用 : 地 理 交叉 问题 
在 地 理学 中 ， 线 和 超 平面 是 以 线性 方程 定义 的 。 确 定 它们 在 何 处 交叉 ， 也 是 求解 线性 方程 组 的 问题 。 


e 复杂 度 为 O(n2m) 的 算法 

如 果 A 是 单位 矩阵 了”， 系 统 的 解答 是 5。 我 们 要 诊断 A 来 获取 与 理想 解答 最 接近 的 解 。 

为 此 ， 我 们 需要 应 用 一 些 能 保留 系统 解 的 变换 ， 比 如 交换 变量 的 顺序 、 交 换 两 个 多 项 式 、 把 一 
个 多 项 式 的 两 边 乘 以 一 个 常数 、 把 两 个 多 项 式 相 加 。 

为 了 简化 数据 操作 且 不 修改 A 和 4。 参数， 我 们 把 这 个 多 项 式 系统 储存 到 矩阵 S 里 。S 由 A 的 
一 个 副本 组 成 ， 我 们 在 副本 中 添加 一 个 列 ， 其 中 包含 b 和 包含 变量 下 标的 额外 一 行 。 因 此 ， 当 各 个 
列 在 S 中 彼此 交换 时 ,我们 能 发 现 每 一 列 与 哪个 变量 相关 。 

不 变量 如 下 : 在 次 迭代 后 ，S 的 前 大 列 都 会 变 成 0， 除 了 值 为 1 的 对 角 线 上 的 元 素 (图 14.4 )。 


中 ”单位 敌阵 是 一 个 方 阵 ， 从 它 的 左上 角 到 右 下 角 的 对 角 线 上 的 元 素 均 为 1。 除 此 以 外 全 部 元 素 为 0。 
译 者 注 
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为 了 得 到 这 个 不 变量 ,我 们 把 S 的 第 行 ， 也 就 是 第 个 多 项 式 除 以 S[k, k] ( 当 它 非 空 时 )， 
就 此 给 下 标 (k 如 值 添加 1。 然后 ， 把 所 有 i 关上 的 多 项 式 中 第 个 多 项 式 减 掉 ， 并 乘 以 因子 SE, k, 
使 得 当 i 关上 时 ， 给 下 标 Gk) 值 添加 0， 如 同 不 变量 要 求 的 那样 。 

如 果 S[k, 有 癌 值 为 空 ， 该 怎么 办 ? 在 这 些 操作 开始 之 初 ， 我们 在 S[k, k] 和 S[m-1, n-1] 围 成 的 长 
方形 内 寻找 一 个 绝对 值 最 大 的 元 素 S[i, jl, PAIGE k AN] 列 ， 以 及 上 行 和 i 行 。 这 些 操作 会 保留 
系统 的 解 。 

如 果 这 个 长 方形 只 包含 0， 又 该 怎么 办 ? 在 这 种 情况 下 ， 对 角 化 操作 会 终止 ， 并 用 如 下 方式 提 
取 最 终 解 。 

如 果 对 角 化 在 次 迭代 后 过 早 地 结束 ， 而 且 S 中 从 大 到 m-1 行 都 是 0， 那 么 需要 检查 这 些 行 的 
最 后 一 列 。 如 果 存 在 一 个 输入 值 是 非 空 值 v， 那么 意味 着 存在 悖 论 0 = v， 因 此 我 们 可 以 断定 这 个 问 
题 没有 人 和解; 否则， 这 个 系统 至 少 有 一 个 解 。 假 设 已 经 执行 了 k 次 迭代 对 角 化 ， 我 们 有志 min{n, 
m}。 如 果 k 二 n， 那 么 系统 有 多 个 解 。 为 了 选择 一 个 解 ， 我 们 把 S 中 从 到 -1 列 中 的 相应 变量 设 
置 为 0， 然 后 就 可 以 在 最 后 一 列 得 到 其 他 变量 的 其 他 值 ， 并 由 S 中 值 为 1 的 对 角 线 来 限定 。 最 终 如 
Ak=n, WA EMEA 


















































1 0 0 

0 10 - 

001. . 
A= b= 

000. ， 

000. 

000. 


E 14.4 当 丰 = 3 时 不 变量 的 结构 


e 实现 细节 

由 于 使 用 浮 点 数 计算 ， 计 算 中 会 存在 精度 问题 ， 因 而 我 们 在 测试 等 于 0 的 时 候 需 要 加 入 阔 值 。 
在 切 分 第 上 行 到 第 i 行 的 时 候 ， 需 要 把 系数 SAA 赋值 给 一 个 变量 fact ， 因 为 这 个 操作 会 改变 Sli] 
[k] 的 值 。 为 了 精确 地 计算 结果 ， 我 们 可 以 使 用 分 数 ， 而 不 再 是 浮 点 数 。 在 这 种 情况 下 ， 在 每 次 迷 
代 时 化 简 分 数 是 非常 重要 的 ， 否 则 解 的 分 子 和 分 母 会 包含 指数 级 的 数字 数量 。 在 不 规范 化 的 情况 
下 ， 高 斯 - 若 尔 当 消 元 法 不 是 多 项 式 时 间 复 杂 度 的 ， 但 所 幸 Python 的 类 库 Fraction 在 每 次 操作 
中 化 简 了 分 数 。 
e 变种 

RE AE bt EET, 也 就 是 当 和 矩阵 每 行 、 每 列 中 的 非 零 元 素 非常 少时 ”, 我 们 可 以 把 计算 时 间 
从 O(n?) 减少 到 O(n)。 





















































O 换 句 话说， 当 0 元 素数 目 远 远 多 于 非 0 元 素 的 数目 ， 并 且 非 0 元 素 分 布 没 有 规律 时 ， 纶 阵 被 称 为 稀 
SAAB, 译 者 注 
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def is zero(x): 
return -le-6 < x and x < le-6 


GJ ZERO SOLUTIONS = 0 
GJ UNE SOLUTION = 1 
GJ_PLUSIEURS SOLUTIONS = 2 


def gauss jordan(A, x, b): 

n = len(x) 
len (b) 
assert len(A) == m and len(A[0]) == 
S = [] 
for i in range(m): 

S.append(A[i][:] + [b[i]]) 
S.append (list (range (n) ) ) 
k = diagonalize(S, n, m) 
if k <m: 

for i in range(k, m): 

if not is zero(S[i][n]): 
return GJ_ZERO_SOLUTIONS 

for j in range (k): 


m 


x[S[m] [j]] = S[j] [n] 
if k < n: 
for j in range(k, n): 
x[S[m][j]] = 0 


return GJ PLUSIEURS SOLUTIONS 
return GJ UNE SOLUTION 


def diagonalize(S, n, m): 
for k in range(min(n, m)): 
val, i, j = max((abs(S[i][j]), 


if is_zero(val): 
return k 


S[i], S[k] = S[k], SI[i] 























# 如 果 使 用 分 数 计算 ， BRA x == 0 





n 


# 把 系统 放 入 一 个 唯一 的 矩阵 S 





# x 中 的 下 标 





i, j) 
for i in range(k, m) 


for j in range(k, n)) 


交换 k 行 了 行 
































# 
for r in range(m + 1): # 交换 k 列 jj 列 
S[r] [j], S[r][k] = S[r][k], S[r] [j] 
pivot = float (S[k] [k]) # 如 果 使 用 分 数 计算 ， 不 需要 float 
for j in range(k, n + 1): 
S[k] [3] /= pivot + 把 k 行 除 以 pivot 
for i in range(m): # 去 掉 工行 到 k 行 
if i != k: 
fact = S[i][k] 
for j in range(k, n + 1): 
Slil] == fact * S[k] [J] 


return min(n, m) 
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14.8 ”和 矩阵 序列 相 乘 


e 定义 
设 有 个 矩阵 My, M,， 其 中 第 站 个 矩阵 有 广 行 和 c 列 ， 且 对 所 有 1 <icn, A= ra RN 
希望 用 最 少 次 数 的 操作 来 计算 M M M, 的 乘积 。 通 过 结合 律 ， 存 在 多 种 添加 括号 的 方式 。 通 过 和 拢 
阵 乘 积 的 结合 律 得 到 以 下 等 式 ， 但 这 些 计算 的 复杂 度 可 能 会 不 同 。 
(((M,M,)M.,)M,= M,(M,(M,(M,))) = MM) MM,), 
为 了 把 两 个 矩阵 M 和 Mi FFE, FTE BUT rcc 次 数字 乘法 的 标准 算法 。 目 的 是 找到 放 
置 括号 的 方法 ， 从 而 用 最 小 的 成 本 执行 乘法 ( 图 14.5 )。 











































































































14.5 用 哪个 括号 做 矩阵 序列 乘法 ， 可 以 让 操作 次 数 最 少 ? 


e SZEJ Oln?) 的 算法 
循环 公式 很 简单 “。 对 于 某 个 1 和 k<n, 最 后 一 个 乘法 把 My, Mi 的 结果 与 Me … M, 的 结 
相 乘 。 其 中 optGi,7) 是 计算 M, o, M 的 最 小 成 本 。 因 此 我 们 有 si, 站 =0， 且 当 i<j 时 
opt(?, j) =min(opt(i,£) + opt(k +1, j) + rcc. (14.1) 


如 果 既 想 计算 最 优 顺序 的 成 本 ， 又 想 计算 最 优 顺 序 本 身 ， 那 么 必须 在 opt 和 矩阵 中 增加 下 标 太 来 
实现 最 小 化 (14.1 )。 这 正 是 以 下 实现 所 做 的 。 函 数 opt_mult (M， opt, i, j) 根据 opt 中 存储 
的 信息 以 最 优 方式 按 顺序 计算 M…, Myo 
TER Phe i Fly 的 处 理 顺序 。 考 虑 j-i 的 升序 ， 可 以 保证 的 是 确定 公式 14.1 中 最 小 值 所 需 的 数 
对 (i, 且 和 (k+l1, 思 值 已 经 计算 完成 。 









































© 复杂 度 仅 和 括号 位 置 的 计算 有 关 ， 与 矩阵 乘法 本 身 无 关 。 
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def matrix mult opt order (M): 


def 


def 


n = len(M) 
r= [len(Mi) for Mi in M] 
c= [len(Mi[0]) for Mi in M] 
opt = [[0 for j in range (n) ] 
arg = [[None for j in range(n) ] 
for j-i in range(1, n): 
for i in range(n = j_ i): 
oS dk ae 主 
opt[i]J[j] = float('inf') 
for k in range(i, j): 
alt = opt[i][k] + opt[k + 1][3] 
if GBt[i] [jl > alt: 
opt [i] [j] = alt 
arg[i][j] =k 


return opt, arg 


matrix chain mult (M): 





j) 


opt, arg = matrix mult opt order (M) 
return apply order(M, arg, 0, len(M) 
_apply order (M, a ip Jy? 
+ --- 包含 矩阵 M[i] 到 M[j] 的 乘法 
if i = j: 
return M[i] 
else: 
k = arg[i] [j] 
A = _apply_order (M, arg, i, k) 
B = _apply_order (M, arg, k + 1, 
row A = range (len (A)) 
row_B = range (len (B) ) 
col B = eee [0])) 
return[[sum(A[a] [b] * B[b] [c] 


. c in col _ B] 


for i in range (n) ] 
for i in range(n) ] 


# 从 j-i 开始 降序 对 i 循环 


+ Yay? * 


-1) 




















+ 根据 放置 括号 的 结果 进行 


for b in row B) 
for a in row A] 








有 一 个 更 好 的 复杂 度 为 O(nlogn) 的 算法 ,这 里 


就 不 多 做 介绍 了 ( 见 参 考 文献 [15] )。 


对 于 有 些 组 合 问题 ， 没 有 能 保证 在 多 项 式 时 间 内 解决 问题 的 已 知 数据 结构 。 这 时 ， 需 要 一 个 遍 
历 所 有 潜在 答案 空间 的 穷 举 法 。 这 里 的 “组 合 ” 指 的 是 简单 数据 结构 组 成 较 复杂 数据 结构 ， 例 如 子 
树 构建 树 ， 用 瓦 片 来 铺路 ， 等 等 。 所 以 ， 穷 举 法 意味 着 遍历 所 有 可 能 构建 的 隐 性 树 ， 借 此 找到 一 个 
解 。 但 是 ， 树 的 节点 表示 部 分 结构 ， 如 果 部 分 结构 不 能 形成 一 个 完整 的 解 ， 比 如 不 满足 某 个 限制 条 
F, 那么 遍历 会 返回 上 一 级 节点 ， 尝 试 男 外 一 个 分 支 。 因 此 ， 这 种 方法 叫 “ 回 溯 法 ”( backtracking )。 

















我 们 会 用 一 个 简单 例子 来 介绍 。 


15.1 激光 路 径 


e 定义 
































假设 一 个 长 方形 网 格 ， 它 被 一 个 在 第 一 行 项 边 左 侧 和 右 侧 有 开口 的 边界 包围 。 网 格 的 某 些 格 子 
中 有 双 面 镜子 ， 可 以 用 对 角 线 和 反对 角 线 方式 布置 ( 图 15.1 )。 我 们 的 目的 是 把 镜子 按照 某 种 方式 
布置 ， 使 得 激光 光束 从 左 侧 开 口 进 入 ， 从 右 侧 开口 离开 。 光 束 在 网 格 中 横向 或 纵向 穿 过 ， 当 它 碰 到 











镜子 时 ， 会 根据 镜子 的 方向 向 左 或 向 右 转 90? WRACA 


。 算法 





























这 个 问题 没有 任何 在 多 项 式 时 间 内 解决 的 已 知 算法 。 我 们 建议 使 
存储 一 个 状态 ， 共 有 三 种 可 能 类 型 的 状态 : 两 个 方向 ， 以 及 “没有 方向 "。 起 初 ， 所 有 镜子 都 没有 





方向 ; 然后 ， 模 拟 激光 光束 从 左 侧 开 


口 进入 ， 并 在 网 格 间 穿 过 。 




















到 网 格 的 边界 ， 就 会 被 吸收 。 











] 穷 举 法 来 实现 。 对 每 个 镜子 








一 当 光 束 碰 到 一 个 有 方向 的 镜子 ， 光 束 会 根据 镜子 的 方向 被 反射 。 
一 当 光 束 碰 到 一 个 没有 方向 的 镜子 ,我们 要 执行 两 个 递归 调用 ， 即 对 镜子 每 个 可 能 方向 分 别 





执行 一 个 调用 。 如 果 其 中 一 个 调用 找到 了 一 个 























解 ， 那 么 它 被 返回 。 如 果 任 何 一 个 调用 都 没 
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有 找到 解 ， 这 面 镜子 就 被 重新 放 回 没有 方向 的 状态 ， 一 个 代表 失败 的 代码 被 返回 。 

一 当 光 束 碰 到 网 格 边界 ， 递 归 过 程 结束 并 返回 一 个 代表 失败 的 代码 。 穷 举 过 程 返回 上 一 层 ， 
也 就 是 “回溯 ”。 

一 最 终 ， 光 束 到 达 右 侧 开 口 ， 返 回 解 。 






































图 15.1 能 让 激光 通过 网 格 的 一 种 镜子 放置 方式 


e 实现 细节 

在 输入 中 给 定 了 初始 位 置 的 n 个 镜子 被 从 0 到 n-1 编号 。 两 个 假想 镜子 被 编号 为 n 和 n+1， 放 
在 两 个 开口 处 。 程 序 生成 一 个 数组 KL， 其 中 有 镜子 的 坐标 和 下 标 。 

光束 的 4 个 可 能 方向 以 0 至 3 这 4 个 整数 编码 ， 镜 子 的 两 个 方向 编码 为 0 和 1。 一 个 维度 为 
4 x 2 的 数组 reflex 表示 光束 以 一 个 给 定 方向 抵达 一 个 给 定 反射 方向 的 镜子 时 发 生 的 方向 变化 。 

在 预先 计算 中 ， 在 一 行 或 一 列 中 的 一 系列 连续 镜子 通过 数组 suce 相关 联 。 对 于 一 个 镜子 i 和 一 
个 方向 d， 当 光束 按 d 方向 离开 了 镜子 1， 输 入 succ[ 引 [d] 表示 光束 遇 到 的 下 一 个 镜子 的 下 标 。 当 光 
束 被 反射 到 边界 时 ， 这 个 输入 值 是 None。 

为 了 填充 数组 succ， 首 先 要 一 行 行 、 一 列 列 地 遍历 数组 KL。 注意 ， 函 数 tri 使 用 字典 序 排序 来 
翻转 行 下 标 和 列 下 标 。 

变量 last i, last_r 和 1ast c 保存 了 在 遍历 中 遇 到 的 最 后 一 个 镜子 的 信息 。 如 果 这 面 镜子 与 当前 
镜子 在 同一 行 〈 按 行 遍历 时 )， 那 么 需要 在 suce 中 把 两 者 编号 设置 为 关联 。 
方向 
UP = 
LEFT 1 
DOWN 2 


RIGHT = 3 
镜子 的 方向 None :? 0:/ 1:\ 































































































i io 





光束 来 的 方向 UP LEFT DOWN RIGHT 
reflex = [[RIGHT, LEFT], [DOWN, UP], [LEFT, RIGHT], [UP, DOWN]] # 与 上 一 行 光束 来 的 
方向 对 应 的 反射 方向 
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def laser mirrors(rows, cols, mir): 
# construire les structures 
n = len(mir) 












































orien = [None] * (n + 2) 
orien[n] = 0 # 开口 格子 里 镜子 的 方向 是 随机 的 
orien[n + 1] = 0 
succ = [[None for direc in range(4)] for i in range(n + 2) ] 
L = [(mir[i] [0], mirfi][1], i) for i in range(n) ] 
L.append((0, -1, n)) # 进入 
L.append((0, cols, n + 1)) ta 
last_r = None 
for(r, c, i) in sorted(L): # 按 行 扫描 
if last r == r; 
succ [i] [LEFT] = last i 
succ[last_i] [RIGHT] = i 


last rs last. i = ry i 
last_c = None 
for(r, c, i) in sorted(L, key= lambda tup rci : (tup_rci[1], tup_rci[0])): 


if last_c == c: + 按 列 扫描 
succ[i] [UP] = last_i 
succ[last_i] [DOWN] = i 
last_c, last i = cj i 
if solve(succ, orien, n, RIGHT): # 遍历 


return orien[:n] 
else: 
return None 


遍历 是 通过 递归 调用 实现 的 。 对 于 此 等 难度 的 问题 ， 实 例 一 般 都 比较 小 ， 使 用 递归 调用 时 不 存 
在 堆栈 溢出 的 问题 。 注 意 ， 在 对 镜子 j 的 两 个 可 能 方向 所 对 应 的 两 个 子 树 执行 无 效 遍 历 以 后 ， 程 序 
会 重 置 变量 内 容 ， 即 改 为 无 方向 状态 。 



































def solve(succ, orien, i, direc): 
assert orien[i] != None 
j = succ[i] [direc] 
if j is None: # 基本 情况 
return False 
if j == len(orien) - 1: 
return True 
if orien[j] is None: # 测试 镜子 的 2 个 方向 
for x in[0, 1]: 
orien[j] = x 
if solve(succ, orien, j, reflex[direc] [x]): 





return True 
orien[j] = None 
return False 
else: 
return solve(succ, orien, j, reflex[direc] [orien[j]]) 
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15.2 ”精确 覆盖 


舞蹈 链 算 法 是 穷 举 算法 中 的 劳 斯 莱 斯 ， 它 能 解决 通用 的 精确 覆盖 问题 。 很 多 问题 都 能 化 简 为 精 
确 和 覆盖 问题 ， 因 此 ， 掌 握 这 种 算法 在 竞赛 中 无 疑 是 一 个 实 实在 在 的 优势 。 






































精确 覆盖 问题 由 一 个 点 的 集合 U ( 称 作 空间 ) 以 及 一 个 U 的 子 集 S S 2" 组 成 (图 15.2)。 当 
x SC AI, 我 们 称 一 个 集合 A SU 覆盖 了 xsU。 目 的 是 找到 S 的 一 个 选择 集 ， 即 一 个 集合 S* S 
S， 使 它 精 确 覆 盖 整 个 空间 中 的 每 个 元 素 一 次 。 

在 输入 中 ， 我 们 收 到 一 个 二 进 制 矩阵 M， 生 阵 的 列 代表 了 整个 空间 中 的 所 有 元 素 ， 行 代表 S 的 
所 有 集合 。 在 xeA 时 ， 和 矩阵 中 的 元 素 <x，A> 值 为 1。 在 输出 中 ， 需 要 生成 一 个 行 的 集合 S* ， 使 得 
被 限制 在 S 里 的 矩阵 在 每 列 精确 地 包含 一 个 1。 


e 应 用 

数 独 游戏 可 以 被 视 为 一 个 精确 覆盖 问题 CL 15.3 节 )。 铺 路 问题 也 是 如 此 ， 即 在 一 个 地 砖 集 
合 中 ， 如 何 覆 盖 一 个 维度 为 m x n 的 网 格 且 没 有 交叉 。 每 块 地 砖 必须 被 精确 地 使 用 一 次 ， 每 个 待 
铺 的 格子 必须 被 一 块 地 砖 覆 盖 。 因 此 ， 格 子 和 地 砖 形成 了 一 个 空间 元 素 ， 而 地 砖 的 铺设 方式 形成 了 


pan 
Ho 



















































































e 舞蹈 链 算法 

算法 实现 的 就 是 上 述 穷 举人 遍历。 其 特色 是 在 实现 中 选择 数据 结构 。 

首先 ， 算 法 选择 一 个 元 素 e， 该 元 素 在 S 的 最 小 集合 中 ， 也 就 是 受 限制 最 多 的 集合 。 这 个 选择 
很 有 可 能 会 生成 一 些小 查找 树 。 由 于 解 必须 覆盖 e， 因 而 一 定 包含 且 仅 包含 一 个 集合 A, WE AES 
且 esA。 因 此 ， 解 的 搜索 空间 被 子 集 的 选择 拆 分 。 对 于 每 个 满足 esA 的 集合 A， 我 们 为 子 问题 搜 
索 一 个 解 $S， 在 找到 这 个 解 的 情况 下 ,， 解 S* U {A} 作为 初始 问题 的 一 个 解 被 返回 。 

M U 中 去 掉 A 的 元 素 后 ， 可 以 从 <U, S> 建立 待 解决 的 子 问题 ， 因 为 每 个 元 素 feA 已 被 A BE 
in, MANGER AK, A, 与 B 的 所 有 交叉 元 素 已 从 S PAH, BMA 中 的 元 素 会 被 覆 
GAM ( 图 15.2). 

为 了 形式 化 包含 矩阵 M， 重 建 后 的 算法 基本 结构 如 下 。 如 果 和 矩阵 M 为 空 ， 那 么 需要 返回 空 集 
合 ， 它 是 一 个 解 ; 和 否则， 寻找 一 个 M 中 可 能 包含 至 少 一 个 1 的 列 c。 在 所 有 可 能 覆盖 c 的 列 > 上 ， 
也 就 是 M,.= 1 的 列 上 进行 循环 。 对 每 个 行 > 执行 下 列 操作 : 从 M 中 去 掉 行 x 和 所 有 被 + (Mw= 1) 
窗 盖 的 列 c 如 果 所 得 矩阵 有 一 个 解 $S， 那 么 返回 S U fr}; 否则 恢复 M。 
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元 素 3 “| 集合 S， 






15.2 选择 元 素 e = 3 带 来 的 三 个 子 问题 。 注 意 ， 第 三 个 子 问题 没 
有 解 ， 因 为 元 素 0 无 法 被 覆盖 


e 链 式 简 约 表 示 方 法 

为 了 简约 表示 稀 玻 矩阵 M， 我 们 只 保存 M 中 包含 一 个 1 的 格子 ， 并 将 它们 通过 横向 和 纵向 的 
两 个 链 关联 起 来 (图 15.3 )。 这 样 一 来 ， 我 们 可 以 轻松 通过 横向 链 来 遍历 所 有 满足 M, = 1 的 列 x。 
每 个 格子 有 四 个 字段 L、R、U、DD 来 编码 双重 链 。 
每 个 列 还 有 一 个 头 部 格子 ， 它 是 纵向 链 的 一 部 分 ， 让 我 们 可 以 访问 列 。 在 建立 结构 时 ， 头 部 格 
子 被 存储 在 一 个 用 列 编号 索引 的 数组 col 中 。 然 后 ， 我 们 得 到 一 个 特殊 格子 h， 它 是 纵向 链 的 一 部 
分 ， 用 来 存储 头 部 格子 以 便 访 问 列 。 这 个 格子 不 使 用 字段 U 和 了 D。 
每 个 格子 有 两 个 额外 字段 S$ 和 C， 其 作用 和 格子 的 类 型 有 关 。 对 于 和 矩阵 的 格子 ，S 保存 行 的 编 
号 ，C 保存 列 的 头 部 格子 。 对 于 列 的 头 部 格子 ，S 保存 列 中 1 的 数量 ， 字 段 C 被 忽略 。 格 子 h 会 忽 
略 这 两 个 字段 。 
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class Cell: 








def init__(self, horiz, verti, S, C): 

self.S =S 

self.c = C 

if horiz: 
self.L = horiz.L 
self.R = horiz 
self.L.R = self 
self.R.L = self 

else: 
self.L = self 
self.R = self 

if verti: 
self.U = verti.U 
self.D = verti 
self.U.D = self 
self.D.U = self 

else: 
self.U = self 
self = self 


def hide verti(self): 
self.U.D = self.D 
self.D.U = self.U 


def unhide verti(self): 


def hide horiz(self): 


def unhide horiz(self): 

































































一 | ,一 一 一 一 | 六 一 | a 
~a (= C lng B 
— | > 
~a c a— 


























图 15.3 ”一 个 二 进 制 矩阵 M， 上 方 是 它 的 编码 ， 下 方 是 覆盖 第 0 列 的 结果 。 链 都 是 
循环 的 ， 链 从 图 的 一 边 离开 ， 再 从 相对 的 另 一 边 重新 进来 
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e 链 
舞蹈 链 算 法 的 思路 源 于 一 松 宏 和 时 下 浩 平 在 1979 年 发 现 并 由 高 德 纳 在 2000 年 描述 的 研究 结果 
见 参 考 文献 [18] ) : 为 了 从 一 个 双向 链表 中 提取 出 一 个 元 素 c， 只 需 改变 其 相 邻 指针 (图 15.4 ) 


































































































































































































为 了 把 元 素 重新 加 入 链表 ， 只 需 按 相反 顺序 执行 反 向 操作 。 
- Tia 二 
- aa ‘esl - 
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15.4 hide 操作 从 一 个 双向 链 中 去 掉 一 个 元 素 c。 不 删除 c 的 指 
针 ， 很 容易 就 能 把 该 元 素 重新 插入 其 初始 位 置 
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RAHI BAR FE EP RRRA. Pc, BERET EAT A AY SK BIT 
素 所 在 横行 中 移 除 ; 同时 ， 对 于 满足 Me= 1 的 行 r， 从 纵向 链 中 去 掉 在 M (M,.=1) 中 所 有 与 位 置 
(r, c) 相关 的 格子 。 注 意 随时 维护 格子 c 头 部 的 计数 器 S， 即 减少 它 的 值 。 








def cover(c): # c = 要 隐藏 的 列 的 头 部 元 素 
assert c.C is None # 必须 是 一 个 头 部 格子 
c.hide horiz() 
i=c.D 
while i != c: 

4 = 4i.R 

while j != i: 
j-hide_ verti () 
4.C.8 == 1 # 这 个 列 中 减少 一 个 元 素 
J 三 了 -及 

i = i.D 


def uncover (c): 
assert c.C is None 
i = c.U 
while i != c: 
j = i.L 
while j != i: 
3.C.S += 1 
j.unhide verti () 
j= g-L 
i= i.U 
c.unhide horiz() 


st 
i 
> 
2 


增加 一 个 元 素 














e 搜索 

在 搜索 过 程 中 ， 我 们 仅 遍 历 所 有 列 来 找到 令 元 素 最 少 的 列 ， 即 最 小 的 计数 器 S。 我 们 用 列 的 
优先 级 队列 来 加 速 操作 ,但 列 的 覆盖 操作 成 本 会 更 高 。 在 函数 返回 true 时 ， 以 下 函数 把 解 写 入 数 
组 sol。 

















def dancing links (size universe, sets): 
header = Cell (None, None, 0, None) # 建立 格子 的 结构 
col = [] 
for j in range (size universe): 
col.append(Cell (header, None, 0, None) ) 
for i in range(len(sets)): 
row = None 
for j in sets[i]: 
col[j].S t= 1 # 这 一 多 
row = Cell(row, col[j], i, col[j]) 
sol = [] 
if solve(header, sol): 
return sol 
else: 
return None 





= 
fat 


增加 一 个 元 素 
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def solve(header, sol): 
if header.R == header: 
return True 
c = None 
j = header.R 
while j != header: 
if c is None or j.S < c.S: 
c= Jj 
j = JER 
cover (c) # 覆盖 这 一 
F =D # 尝试 这 一 
while r != c: 
sol.append(r.S) 
j = 工 -R # 在 元 素 r 中 覆盖 元 素 
while j != r: 
cover (j.C) 
J 二 a 
if solve (header, sol): 
return True 
j= ab # 
while j != r: 





+ 


空 的 输入 值 ， 找 到 答案 


+ 


搜索 最 小 覆盖 的 列 








ni 
T 


uncover (j.C) 
j =j.L 
sol.pop() 
r=r.D 
uncover (c) 
return False 











15.3 žk 


很 多 贪 禁 算 法 都 能 高 效 地 解决 经 典 数 独 问题 (图 15.5 )。 但 对 于 16 x 16 的 网 格 数 独 问题 来 说 ， 
舞蹈 链 算 法 更 合适 。 















































图 15.5 一 道 网 格 数 独 题 。 目 的 是 把 空格 子 填 满 ， 满 足 每 行 、 每 列 
和 每 个 3x 3 方块 都 包含 从 1 到 9 的 所 有 整数 


° 建 模 








如 何 把 一 道 数 独 题 建 模 为 一 个 精 表 


mild? 有 48 




















独 网 格 的 每 一 行 、 每 一 列 和 每 


个 方块 ， 每 个 值 只 能 精 古 
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制 条 件 ， 每 个 格子 必须 有 一 个 值 ; 在 数 




















地 出 现 一 次 。 因 此 ， 在 空间 中 有 4 种 元 




















R: 行列 对 、 行 值 对 、 列 值 对 和 块 值 对 。 这 些 元 素 组 成 了 精确 





和 覆盖 问题 实例 <U, S> 的 空间 U, 





现在 ，S 的 集合 将 构成 赋值 法 ， 也 就 是 “行列 





值 ” 三 元 组 。 每 个 赋值 精确 





盖 空 间 汇 总 的 


4 个 元 素 。 









































间 中 添加 一 个 新 元 素 e， 
。 因 此 ， 所 有 结果 必须 由 A 组 成 。 接 下 




















这 一 描述 用 简洁 、 便 利 的 方式 抽象 表达 了 行 、 列 、 块 和 值 ， 让 问题 更 容易 处 理 。 
如 何在 实例 中 给 数 独 网 格 中 有 固定 值 的 格子 编码 呢 ? 我 们 的 方法 是 在 空 

并 在 S 中 添加 一 个 新 集合 A 一 一 它 是 唯一 一 个 包含 e 的 集合 

来 只 需 在 A 中 填 入 空间 中 被 初始 赋值 覆盖 了 的 所 有 元 素 。 

© 编码 
FEH 











式 来 返回 结果 。 因 此 ， 为 了 找到 与 下 标 相关 的 赋值 ， 必 
































盖 实 例 <U, S> 的 集合 与 赋值 相关 ， 而 舞蹈 链 算法 的 实现 以 被 选中 元 素 的 下 标 数组 形 


须 明 确 一 种 编码 方法 。 将 v 值 填 入 行 r 





























列 c 的 格子 ， 我们 将 这 一 赋值 编码 为 81r + 9c + v (对 于 16x16 的 数 独 网 格 ， 把 参数 蔡 换 为 
256 和 16 )。 
同样 ， 空 间 中 元 素 也 被 编码 成 整数 ， 比 如 行列 对 (x, c) 被 编码 为 9r + c， 列 值 对 (x, v) 被 编码 为 
81 十 9r 十 v， 以 此 类 推 。 
N = 3 # 全 局 常量 
N2=N*N 
N4 = N2 * N2 
# 集合 


def assignation(r, c, v): return 











def row(a): return a // N4 
def col(a): return(a // N2) % N2 
def val(a): return a % N2 
def blk(a): return(row(a) // N) * N + col(a) // N 
# 待 覆盖 元 素 
def rc(a): return row(a) * N2 + col(a) 
def rv(a): return row(a) * N2 + val(a) + N4 
def cv(a): return col(a) * N2 + val(a) + 2 * N4 
def bv(a): return blk(a) * N2 + val(a) + 3 * N4 
def sudoku (G): 
global N, N2, N4 
if len(G) == 16: # 对 于 16 x 1 
N, N2, N4 = 4, 16, 256 
e=4* N4 
univers =e+ 1 
S = [[ré(e);, rva); evle), bvwle)] 


r* N4 + ¢ * N2 + 


for a in range(N4 * N2) ] 


6 的 数 独 问题 
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A = [e] 
for r in range(N2): 
for c in range (N2): 


if G[r][c] != 0: 
a = assignation(r, c, G[r][c] - 1) 
A += S[a] 
sol = dancing links(univers, S + [A]) 


1f sol: 
for a in sol: 
if a < len(S): 
G[row(a)][col(a)] = val(a) + 1 
return True 
else: 
return False 








15.4 ”排列 枚 举 


e 应 用 





一 些 缺 乏 结构 的 问题 需要 用 穷 举 法 解决 ， 在 所 有 潜在 解 范围 内 逐个 测试 每 个 元 素 。 因 此 ， 有 时 














需要 遍历 一 个 给 定数 组 的 所 有 排列 。 
e 例子 : 单词 相 加 


考虑 下 面 格式 的 问题 : 
SEND 
+ MORE 
=MONEY 

















给 每 个 字符 赋予 一 个 唯一 的 数字 ， 使 得 每 个 单词 成 为 一 个 开头 不 为 0 的 数字 ， 并 令 加 法 等 式 成 











立 。 用 穷 举 法 解决 问题 时 ， 只 需 建立 一 个 由 问题 中 字母 组 成 的 数组 tab = ““@@DEMNORSY”, 并 

















J 





足够 多 的 @ 将 数组 补 全 到 10 个 字符 。 现 在 ， 把 每 个 字母 和 其 在 数组 中 的 位 置 关 联 ， 令 数组 排列 和 





字母 的 赋值 之 间 有 了 相关 性 。 
其 中 有 意义 的 是 枚 举 一 个 列表 的 所 有 排列 ， 这 正 是 本 章 的 主题 。 









































et 


给 定 一 个 及 个 元 素 的 数组 :， 我 们 希望 确定 ! 之 后 的 一 个 字典 序 排列 ， 或 者 确 
大 的 。 
e 关键 测试 

为 了 把 上 排列 成 其 身后 的 字典 序数 组 ， 我 们 想 保 留 最 长 的 前 绥 ， 而 且 只 在 后 缀 中 交换 元 素 。 








1 已 经 是 最 





° 线性 时 间 复 杂 度 的 算法 
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算法 基于 三 个 步 绝 。 第 一 ,需要 找到 最 大 下 标 p (PRA “AW”, pivot), 使 得 tp]<t[p+1]。 思 路 























是 由 于 从 p+1 开始 的 + 的 后 级 是 一 个 非 增长 序列 ， 因 此 该 后 级 已 是 字典 序 中 最 大 的 ; 所 以 ， 如 果 不 











存在 这 样 一 个 轴 ， 算 法 即 可 宣告 ! 是 最 大 字符 ， 并 结束 。 











显然 ， 此 时 t[p] 应 当 增 长 ， 然 而 是 以 最 小 化 的 方式 增长 。 因 此 ， 我 们 在 后 级 中 寻找 一 个 下 标 s 
使 得 t[s] 最 小 ， 且 有 ts]<t[p]。 因 为 p+1 是 候选 者 ， 所 以 这 样 一 个 下 标 总 存在 。 在 把 t[s] 和 tp] 交 
换 以 后 ， 我 们 得 到 一 个 字典 序 大 于 初始 数组 的 数组 。 最 终 ， 从 p+1 开始 把 :的 后 绥 按 升序 排列 ， 借 











此 ,我们 获得 在 前 级 t[1…p] 中 最 小 的 排列 ( 图 15.6 )。 





初始 数组 0 2 l 
选择 轴 Ö 2 qi) 
交换 0 2 [2] 
反 转 0 2 2 
最 终 数组 0 2 2 


6 5 2 
6 5 2 
6 5 {H 
fl 1 5 
i ï 4 


图 15.6 计算 后 续 的 排列 
将 后 级 按照 升序 排列 又 变 回 将 其 元 素 反 转 的 操作 ， 因 为 最 初 元 素 是 降序 排列 的 。 











def next permutation (tab): 
n = len(tab) 


pivot = None # 找到 轴 


for i in range(n - 1): 
if tab[i] < tab[i + 1]: 
pivot =i 














if pivot is None: # 数组 已 是 最 大 
return False 
for i in range(pivot + 1, n): # 确定 竺 交换 元 素 
if tab[i] > tab[pivot]: 
swap = i 
tab[swap], tab[pivot] = tab[pivot], tab[swap] 
i = pivot + 1 
Jansi # 把 后 级 反 转 
while i < j: 
tab[i], tab[j] = tab[j], tab[i] 
i += 1 
j -= 1 


return True 




















因此 ， 单 词 相 加 问题 的 解 可 以 用 如 下 方式 编码 : 














def convert (word, ass): 
retval = 0 
for x in word: 
retval = 10 * retval + ass[x] 
return retval 


def solve word addition (S): # 


Bi 





回 解 的 数字 
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n = len(S) 
letters = sorted (list(set(''.join(S)))) 
not, zero = '' 
for word in S: 
not_zero += word[0] 
tab = ['@'] * (10-len(letters)) + letters 
count = 0 
while True: 


ass = {tab[i]: i for i in range(10) } 
if tab[0] not in not zero: 
sum = - convert(S[n-1], ass) 


for word in S[:n-1]: 
sum += convert(word, ass) 
if sum == 0: 
count += 1 
if not next permutation (tab) : 
break 





return count 





























E 确 ? 








e 变种 : 组 合 和 排列 的 枚 举 





E n SICK PRE 上 种 元 素 组 合 ， 即 {1,…, n} H 








PhP 有 个 元 素 的 部 分 ， 技巧 是 在 二 进 制 掩 码 


“Wek, 不 取 n-K” 的 排列 上 进行 迭代 。 这 个 掩 码 也 就 是 由 n-k 个 元 素 0 及 其 后 续 的 上 个 元 素 1 组 


成 的 数组 ， 因 此 它 能 让 我 们 选择 保存 在 子 集中 的 元 素 。 





为 了 枚 举 n 个 元 素 的 种 排列 方式 ， 只 需 枚 举 n 个 元 素 的 种 元 素 组 合 ， 
MEI next_permutation 的 解决 方法 。 这 给 我 们 提供 了 另 一 种 解决 单词 相 加 问题 的 解法 : 选 


























FE 10 个 字母 中 上 个 字母 的 排列 方式 ， 其 中 大 是 不 同 字母 的 数量 。 











这 就 回 到 了 使 用 两 个 





我 们 还 将 介绍 一 种 技术 ， 其 实 它 已 在 1.6.6 节 中 提 到 过 。 这 种 技术 能 更 有 技巧 性 地 遍历 一 个 有 普 


个 元 素 的 集合 的 各 个 部 分 ， 以 此 来 解决 一 大 类 动态 规划 问题 。 


15.5 正确 计算 





这 一 问题 来 自 法 国电 视 节 目 《 数 字 和 字母 》 中 一 个 著名 的 游戏 。 








输入 : n+l 个 整数 6…, i, b 是 一 个 比 n 小 的 数 , 设 n <20, 
输出 : 一 个 算数 表达 式 最 多 使 用 每 个 整数 一 次 ， 采 用 任意 次 加 减 乘除 运算 符 ， 令 计算 结果 尽 可 
能 接近 5。 减法 只 人 允许 在 结果 为 正 整数 时 使 用 ， 除 法 只 允许 在 结果 能 被 整除 时 使 用 。 























e 复杂 度 为 0(3") 的 算法 








算法 通过 穷 举 法 和 动态 规划 法 实现 。 在 一 个 字典 EE 中， 我 们 把 S © {1,…, n-1} 与 最 多 使 
用 一 次 输入 Cies) 计算 所 得 的 结果 关联 "。 具 体 来 讲 ，E[S] 成 了 把 每 个 可 




















中 AT SØ, CRAT. 








得 结果 值 与 表达 式 相 
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关联 的 字典 。 

比如 ， 对 于 x = (3, 4, 1,8) E S= {0, 1}, 字典 ECS) 包含 了 键 x 和 值 e 的 数值 对 ， 其 中 e 是 由 输 
A x= 3 F x = 4 组 成 的 表达 式 ， 而 x 是 e 的 值 。 因 此 Els] 包含 了 键 值 对 1 一 4-3、3 一 3、4 一 4， 
7 > 3+4 和 12 一 3x4。 

为 了 计算 ELS], RIE S 的 两 个 非 空 集 L 和 R 分 段 上 进行 循环 。 对 于 BLL] 中 通过 一 个 表达 式 
e, 即 可 得 到 的 每 个 值 v,， 以 及 E[R] 中 通过 一 个 表达 式 en 即 可 得 到 的 每 个 值 w， 我 们 都 可 以 重建 新 
值 并 存储 于 ELS] Po FUL, vet, 可 以 通过 表达 式 er+en 计算 得 到 。 


算法 的 复杂 度 可 以 用 如 下 方式 评估 。 对 于 每 个 基数 天 amfi) E ISIK 的 集合 S。 对 于 每 
个 集合 S， 其 所 有 子 集 工 要 被 考虑 ， 后 着 数量 是 2。 固定 的 8 和 二 所 需 工 作 量 是 常数 ， 因 此 算法 复 
杂 度 是 > ， (=o. 


在 处 理 S 的 子 集 时 要 特别 注意 ， 必 须 遵 守 基 数 的 升序 排序 。 这 样 ， 我 们 可 以 保证 所 有 集合 ELL] 
和 ELR] 都 已 经 确定 。 









































e 实现 细节 

为 了 在 一 个 集合 中 所 有 大 小 为 的 分 段 上 进行 迭代 ， 需 要 一 个 枚 举 方法 。 我 们 要 实现 的 函数 是 
all_subsets， 采 用 迭代 顺 的 描述 形式 。Python 的 迭代 器 不 使 用 return 语句 而 使 用 yie1ld 语 
句 返 回 每 个 结果 ， 这 样 能 不 中 断 迭 代 器 的 执行 。 

函数 all subsets (n, k) 会 枚 举 基 数 k 的 所 有 分 段 S E {0,…, n-1}。 如 果 i 是 S 中 的 最 大 
值 ， 那 么 对 于 一 个 基数 k-1 的 分 段 S'S {0,…, n-1}，S 可 以 记 作 S'U {i}. PAM all sebsets 的 
实现 将 使 用 这 一 拆 分 方法 。 
def all subsets(n, card): 

if card == 0: 


yield 0 
else: 


























for i in range(card - 1, n): 
for e in all subsets(i, card = 1): 
yielde | (1 << i) 


def arithm_expr target (x, target): 
n = len(x) 
expr = {} 
for i in range(n): 
expr[1 << i] = {x[i]: stxr(x[i])} 
tout = (1 << n} = 1 
for card in range(2, n + 1): 
for S in all subsets(n, card): 
expr[S] = {} 
for L in range(1, S): 
if L & S = L: 
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R=SsS ^L 

for vL in expr[L]: 
for vR in expr[R]: 
eL = expr[L] [vL] 
eR = expr[R] [vR] 





























expr[S] [vL] eL 
expr[S] [vL + vR] = "(%st+%s)" % (eL, eR) 
expr[S] [vL - vR] = "(%s-%s)" % (eL, eR) 
expr[S] [vL * vR] = "(%s*%s)" % (eL, eR) 
if vR != 0 and vL % vR == 0: 
expr[S] [vL // vR] = "(%s/%s)" % (eL, 
# 查找 距离 目标 最 近 的 算式 
for dist in range(target + 1): 
for sign in[-1, +1]: 
val = target + sign * dist 
if val in expr[tout]: 
return "%s=%i" % (expr[tout] [val], val) 











# UR x 中 包含 在 0 和 
pass 








标 值 之 间 的 数字 ， 这 一 部 分 永远 不 会 执行 
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调试 工具 


如 果 你 在 解决 问题 的 过 程 中 被 卡 住 ， 不 妨 和 这 只 鸭子 聊 一 聊 ， 跟 它 详细 、 准 确 地 解释 你 的 方 
案 ， 向 它 讲解 你 的 每 一 行 代码 ， 这 样 肯定 能 帮 你 找到 错误 或 解决 办 法 。 
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